크롤링1 [Python] BeatifulSoup 활용 인터넷 정보 크롤링 리뷰 정보, 뉴스 기사 등 웹 페이지에서의 텍스트 데이터를 수집할 때 유용하게 사용되는 파이썬 BeatifulSoup 라이브러리 이번 예제를 통해 BeatifulSoup을 활용하여 인터넷 뉴스의 텍스트 데이터를 수집해 보도록 한다. 라이브러리 설치 !pip install beautifulsoup4 설치는 아나콘다 혹은 개별 IDE에서 pip 명령어로 간단히 할 수 있다. 웹 페이지 url 분석 간단한 코드 작성으로 원하는 웹 페이지의 텍스트를 수집하면 좋겠지만, 여러 페이지의 내용을 크롤링 할 때 단순 반복문으로 크롤링 하기 복잡한 구조로 되어있을 경우 코드 작성에 어려움이 있을 수 있다. 이번 예제는 단순한 소스 코드 작성의 특성상 순차적인 웹 페이지 넘버링이 되어있는 웹 페이지를 활용할 것이다. 이번.. 2022. 7. 13. 이전 1 다음 반응형