본문 바로가기

Beautifulsoup2

[파이썬] 웹 크롤링 후 csv로 저장하기 - Pandas / BeautifulSoup 네이버의 view 페이지에서 키워드를 검색하면 나오는 사이트들을 제목과 링크로 정리해보려 합니다. 예시) title link 제목 1 사이트 링크 1 제목 2 사이트 링크 2 먼저, 필요한 라이브러리를 설치해줍니다. import urllib.request as req from bs4 import BeautifulSoup cs 키워드를 입력받아 네이버 검색 페이지 url 링크 설정 url1 : 네이버 view 페이지 / url2 : 검색어 url1 = 'https://search.naver.com/search.naver?where=view&sm=tab_jum&query=' url2 = input('검색어를 입력해주세요: ') url = url1 + url2 cs BeautifulSoup 라이브러리로 데이터.. 2022. 4. 22.
[파이썬] 웹 크롤링 - BeautifulSoup 라이브러리 파이썬으로 웹 크롤링을 진행할 수 있습니다 :) 웹 크롤링을 위해서는 먼저 아래 준비단계가 필요합니다. 1. BeautifulSoup 라이브러리 import BeautifulSoup 라이브러리란? HTML 혹은 XML 파일에서 원하는 데이터를 손쉽게 parsing (분석)할 수 있게 만드는 라이브러리 from bs4 import BeautifulSoup cs 2. 데이터 이름 설정 # 예시 1) 직접 내용 타이핑 html = ''' 스크레이핑이란? 웹 페이지를 분석하는 것 원하는 부분을 추출하는 것 ''' # 예시 2) 크롤링할 링크 삽입 html = 'https://www.naver.com' cs 3. Parsing 처음에 import한 BeautifulSoup 라이브러리를 사용해 데이터를 parsin.. 2022. 4. 20.