반응형
from bs4 import BeautifulSoup
from requests import *
# 해당 사이트에 접속하여 Devtool로 볼 경우 데이터가 확인이 되지만 실제 크롤링 후 스크래핑시 데이터가 확인 안될 경우는 AJAX및 JS로 직접 태그가 생성되도록 제작되었음.
# 이럴경우 스크래핑 하기가 어려워짐
url = "https://www.koreabaseball.com/TeamRank/TeamRank.aspx"
result = get(url)
result.raise_for_status()
html = BeautifulSoup(result.text,"lxml")
baseball = html.find("div",attrs={"id":"cphContents_cphContents_cphContents_udpRecord"})
team = baseball.find("tbody")
tr = team.find_all("tr")
w = 0
for a in tr:
td = tr[w].find_all("td")
print(td[1].get_text())
w+=1
index에서는 ajax로 받아오는것이라 힘듦
반응형
'Back > Python' 카테고리의 다른 글
Python (그래프) (1) | 2022.09.29 |
---|---|
Python (import pandas) (0) | 2022.09.29 |
python 웹스크래핑(네이버웹툰 인기) (0) | 2022.09.21 |
python 웹스크래핑(네이버뉴스 인기) (1) | 2022.09.21 |
python 예외처리 및 크롤링 저장 (0) | 2022.09.21 |