본문 바로가기

iaa.dev/Python3

교보문고의 연간 베스트셀러 가져오기- 3 이전 글에서 한페이지에서 얻을 수 있는 데이터갯수를 늘리는 법을 알아봤습니다. 교보문고의 베스트셀러 정보 가져오기-2 이전에 쓴글 교보문고 Python 으로 베스트셀러 정보 가져오기 (스크레이핑) 교보문고 베스트셀러 페이지에서 Python 으로 랭킹정보를 가져오는 간단한 스크레이핑에 대해 설명하겠습니다. 먼저 교 vuxy.tistory.com from bs4 import BeautifulSoup as bs from urllib import request, parse data = parse.urlencode({'perPage': '500'}).encode() req = request.Request("http://www.kyobobook.co.kr/bestSellerNew/bestseller.laf", da.. 2021. 12. 3.
교보문고의 베스트셀러 정보 가져오기-2 이전에 쓴글 교보문고 Python 으로 베스트셀러 정보 가져오기 (스크레이핑) 교보문고 베스트셀러 페이지에서 Python 으로 랭킹정보를 가져오는 간단한 스크레이핑에 대해 설명하겠습니다. 먼저 교보문고의 베스트셀러 정보 제공 페이지의 URL 은 http://www.kyobobook.co.kr/bestSell vuxy.tistory.com 에서 문제점이라면 문제점이 하나 있습니다. 한번 가져올때 데이터가 20개씩뿐이라는거죠. 디폴트로 화면상에 20개씩 뿌려주고 있고 , 다음페이지로 이동할때도 링크에 마우스를 얹어보니 javascript 로 데이터를 주고 받는 듯하니 어떤 파라미터들을 넘기고 있는지 html 소스를 확인해봐야할듯합니다. 베스트셀러 페이지인 http://www.kyobobook.co.kr/be.. 2021. 12. 3.
교보문고 Python 으로 베스트셀러 정보 가져오기 (스크레이핑) 교보문고 베스트셀러 페이지에서 Python 으로 랭킹정보를 가져오는 간단한 스크레이핑에 대해 설명하겠습니다. 먼저 교보문고의 베스트셀러 정보 제공 페이지의 URL 은 http://www.kyobobook.co.kr/bestSellerNew/bestseller.laf?orderClick=d79 로 orderClick 이 어떤 파라미터인지 모르지만 일단 그대로 사용해보겠습니다. from urllib.request import urlopen from bs4 import BeautifulSoup as bs # 교보문고 베스트셀러 URL url = "https://www.kyobobook.co.kr/bestSellerNew/bestseller.laf?orderClick=d79" html = urlopen(url).. 2021. 12. 2.