반응형
NOOWGNAJ
Run To IT
NOOWGNAJ
전체 방문자
오늘
어제
  • 분류 전체보기 (163)
    • Flutter (3)
    • Back (77)
      • JAVA (13)
      • JAVA 응용문제 (8)
      • JSP (16)
      • Spring (5)
      • Python (26)
      • nexacro (3)
      • jstl (6)
    • Database (8)
      • MySQL (6)
      • MSSQL (2)
    • Front (44)
      • HTML (34)
      • CSS (0)
      • JavaScript (5)
      • Vue.js (5)
    • 코딩테스트 (4)
      • SQL (3)
      • JS (1)
    • MUSIC (1)
      • 장운박스 (1)
    • 임시 메모장 (21)
      • 메모장1 (21)

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

인기 글

태그

  • 핸드폰번호정규식
  • 자바스크립트
  • 이메일정규식
  • 정규식모음
  • 정규식
  • 자바스크립트정규식
  • 주민번호정규식
  • regex

최근 댓글

최근 글

티스토리

hELLO · Designed By 정상우.
NOOWGNAJ

Run To IT

Back/Python

python 웹스크래핑(kbo순위)

2022. 9. 21. 18:34
반응형
from bs4 import BeautifulSoup
from requests import *
# 해당 사이트에 접속하여 Devtool로 볼 경우 데이터가 확인이 되지만 실제 크롤링 후 스크래핑시 데이터가 확인 안될 경우는 AJAX및 JS로 직접 태그가 생성되도록 제작되었음.
# 이럴경우 스크래핑 하기가 어려워짐
url = "https://www.koreabaseball.com/TeamRank/TeamRank.aspx"
result = get(url)
result.raise_for_status()

html = BeautifulSoup(result.text,"lxml") 
baseball = html.find("div",attrs={"id":"cphContents_cphContents_cphContents_udpRecord"})
team = baseball.find("tbody")
tr = team.find_all("tr")

w = 0
for a in tr:
    td = tr[w].find_all("td")
    print(td[1].get_text())
    w+=1

index에서는 ajax로 받아오는것이라 힘듦

반응형
저작자표시 (새창열림)

'Back > Python' 카테고리의 다른 글

Python (그래프)  (1) 2022.09.29
Python (import pandas)  (0) 2022.09.29
python 웹스크래핑(네이버웹툰 인기)  (0) 2022.09.21
python 웹스크래핑(네이버뉴스 인기)  (1) 2022.09.21
python 예외처리 및 크롤링 저장  (0) 2022.09.21
    'Back/Python' 카테고리의 다른 글
    • Python (그래프)
    • Python (import pandas)
    • python 웹스크래핑(네이버웹툰 인기)
    • python 웹스크래핑(네이버뉴스 인기)
    NOOWGNAJ
    NOOWGNAJ
    Innovation. Development. Evolution. Passion. Smart. Teamwork.

    티스토리툴바