본문 바로가기
코딩

웹 크롤러 짤 때 유용한 팁 -soup.select()-

by 김유로01 2022. 5. 14.
728x90
반응형

 

select 문법

 

soup.select('.class명') -> 클래스 찾아줌. 여기서 . 은 html 용어로 클래스를 말함.

soup.select('#id명') -> id 찾아줌.

soup.select('태그명') -> html 태그 찾아줌. html 태그는 아무것도 안 붙여도 가능.

 

붙여서도 가능함

 

 

soup.select('lnl#sheet')

 

 

태그가 lnl 이고 id 가 sheet 이라는 데이터 출력 가능.

 

두개를 사용할 수도 있다.

 

 

soup.select('.class명1 .class명2') -> 1번 클래스 안에 있는 2번 클래스 찾아주세요! (띄어쓰기는 ~안에라는 뜻이므로)

 

 

bibi = soup.select('.wala .dodo em')[0].text
print(bibi)

 

 

위의 것은 class_="wala" 안의 class_="dodo" 안의 태그명이 'em'인 것을 읽어달라고 하는 것임!

 

 

 

다시 한 번 정리하자면

 

 

soup.find_all('태그명')[0].text
== soup.select('태그명)[0].text

 

soup.find_all(class_="class명")[0].text
== soup.select('.class명')[0].text

 

soup.find_all(id="아이디명")[0].text
==soup.select('#아이디명')[0].text

 

 

이걸 좀 더 적극적으로 활용하자면

 

 

soup.find_all('좔좔라라', id="비비부부")[0].text

-> soup.select('좔좔라라#비비부부)[0].text

 

 

이렇게 간소화할 수 있는 것이다.

그냥 붙이기만 하면 된다. 

 

끝!

728x90
반응형

댓글