코딩
웹 크롤러 짤 때 유용한 팁 -soup.select()-
김유로01
2022. 5. 14. 15:19
728x90
반응형
select 문법
soup.select('.class명') -> 클래스 찾아줌. 여기서 . 은 html 용어로 클래스를 말함.
soup.select('#id명') -> id 찾아줌.
soup.select('태그명') -> html 태그 찾아줌. html 태그는 아무것도 안 붙여도 가능.
붙여서도 가능함
soup.select('lnl#sheet')
태그가 lnl 이고 id 가 sheet 이라는 데이터 출력 가능.
두개를 사용할 수도 있다.
soup.select('.class명1 .class명2') -> 1번 클래스 안에 있는 2번 클래스 찾아주세요! (띄어쓰기는 ~안에라는 뜻이므로)
bibi = soup.select('.wala .dodo em')[0].text
print(bibi)
위의 것은 class_="wala" 안의 class_="dodo" 안의 태그명이 'em'인 것을 읽어달라고 하는 것임!
다시 한 번 정리하자면
soup.find_all('태그명')[0].text
== soup.select('태그명)[0].text
soup.find_all(class_="class명")[0].text
== soup.select('.class명')[0].text
soup.find_all(id="아이디명")[0].text
==soup.select('#아이디명')[0].text
이걸 좀 더 적극적으로 활용하자면
soup.find_all('좔좔라라', id="비비부부")[0].text
-> soup.select('좔좔라라#비비부부)[0].text
이렇게 간소화할 수 있는 것이다.
그냥 붙이기만 하면 된다.
끝!
728x90
반응형