python 웹스크래핑(kbo순위)

from bs4 import BeautifulSoup
from requests import *
# 해당 사이트에 접속하여 Devtool로 볼 경우 데이터가 확인이 되지만 실제 크롤링 후 스크래핑시 데이터가 확인 안될 경우는 AJAX및 JS로 직접 태그가 생성되도록 제작되었음.
# 이럴경우 스크래핑 하기가 어려워짐
url = "https://www.koreabaseball.com/TeamRank/TeamRank.aspx"
result = get(url)
result.raise_for_status()

html = BeautifulSoup(result.text,"lxml") 
baseball = html.find("div",attrs={"id":"cphContents_cphContents_cphContents_udpRecord"})
team = baseball.find("tbody")
tr = team.find_all("tr")

w = 0
for a in tr:
    td = tr[w].find_all("td")
    print(td[1].get_text())
    w+=1

index에서는 ajax로 받아오는것이라 힘듦

저작자표시 (새창열림)

'Back > Python' 카테고리의 다른 글

Python (그래프) (1)	2022.09.29
Python (import pandas) (0)	2022.09.29
python 웹스크래핑(네이버웹툰 인기) (0)	2022.09.21
python 웹스크래핑(네이버뉴스 인기) (1)	2022.09.21
python 예외처리 및 크롤링 저장 (0)	2022.09.21

'Back > Python' 카테고리의 다른 글

티스토리툴바