본문 바로가기

728x90

웹크롤러2

웹 크롤러 짤 때 유용한 팁 -soup.select()- select 문법 soup.select('.class명') -> 클래스 찾아줌. 여기서 . 은 html 용어로 클래스를 말함. soup.select('#id명') -> id 찾아줌. soup.select('태그명') -> html 태그 찾아줌. html 태그는 아무것도 안 붙여도 가능. 붙여서도 가능함 soup.select('lnl#sheet') 태그가 lnl 이고 id 가 sheet 이라는 데이터 출력 가능. 두개를 사용할 수도 있다. soup.select('.class명1 .class명2') -> 1번 클래스 안에 있는 2번 클래스 찾아주세요! (띄어쓰기는 ~안에라는 뜻이므로) bibi = soup.select('.wala .dodo em')[0].text print(bibi) 위의 것은 class_.. 2022. 5. 14.

웹에서 정보 뽑아먹기 - 웹 크롤러 만드는 법- 터미널 창에 pip install requests pip install bs4 하나씩 입력한다 그 후에 import requests from bs4 import BeautifulSoup 이렇게 코드를 입력해 놓으면 웹 크롤러 제작 기반 마련 성공이다. 굳이 설명하자면 import requests는 웹 사이트 접속 도와주는 라이브러리 개념이고 from bs4 import BeautifulSoup는 html 웹문서 분석 도와주는 라이브러리 개념이다 데이터 = requests.get('url') 데이터를 가져오고자 하는 url을 준비하고 저기에 입력한다. url의 정보를 데이터 안에 저장하는 것. print(데이터.status_code) 먼저 웹 페이지 접속이 원활하게 되고 있는지 확인하기 위해 위 코드를 입.. 2022. 5. 4.

이전 1 다음

티스토리툴바