728x90 네이버 블로그 크롤링1 네이버 블로그 크롤링 하는 법 - 파이썬 웹 크롤링 - 스크롤이 계속 내려가는 사이트 크롤링 하는 법 일반적인 사이트는 1페이지, 2페이지 이렇게 나뉘어 있는 경우가 많다. 하지만 어떤 사이트들은 페이지 구분 없이 스크롤을 내리면 내릴수록 계속해서 정보가 나오는 사이트들도 있다. 이런 사 breakmatrix.tistory.com 저번 포스팅에 이어서 블로그 주소를 가져왔다고 치고 다음 단계로 넘어가려 한다. 그랬더니 정보가 오기는 하는데 html 값으로 되어있어서 전혀 읽을 수가 없다. 우선 가장 먼저 해야 할 일은 여기에 담겨있는 백 슬래시를 지워야 한다. html 값이 넘어오면서 백 슬래시가 있는 경우가 있는데 파이썬이 읽는데 방해가 되기 때문에 가장 먼저 지우도록 하자. 지우는 함수는 replace() 이므로 soup = BeautifulSoup(da.. 2022. 5. 25. 이전 1 다음 반응형