본문 바로가기

pandas3

[Pandas] DataFrame 행/열 이름 설정, 이름 변경, 삭제, 선택 행/열 이름 설정하기 아래와 같은 데이터가 있다고 가정할 때, 다음과 같이 dataframe을 생성하면서 행과 열의 이름을 설정할 수 있습니다. 0 1 2 0 1 2 3 1 4 5 6 2 7 8 9 행은 index=[행 이름], 열은 column=[열 이름] 이름 대신 range, 혹은 숫자로 이름을 설정할 수도 있습니다. 1 pd.DataFrame(df, index = range(10,13), columns=['a', 'b', 'c']) cs 결과값: a b c 10 1 2 3 11 4 5 6 12 7 8 9 1 pd.DataFrame(df, index = ['철수', '영희', '지웅'], columns=['수학', '영어', '국어']) cs 결과값: 수학 영어 국어 철수 1 2 3 영희 4 5 6.. 2022. 5. 31.
[파이썬] 웹 크롤링 후 csv로 저장하기 - Pandas / BeautifulSoup 네이버의 view 페이지에서 키워드를 검색하면 나오는 사이트들을 제목과 링크로 정리해보려 합니다. 예시) title link 제목 1 사이트 링크 1 제목 2 사이트 링크 2 먼저, 필요한 라이브러리를 설치해줍니다. import urllib.request as req from bs4 import BeautifulSoup cs 키워드를 입력받아 네이버 검색 페이지 url 링크 설정 url1 : 네이버 view 페이지 / url2 : 검색어 url1 = 'https://search.naver.com/search.naver?where=view&sm=tab_jum&query=' url2 = input('검색어를 입력해주세요: ') url = url1 + url2 cs BeautifulSoup 라이브러리로 데이터.. 2022. 4. 22.
Pandas - 1차원 자료 (Series), 2차원 자료(DataFrame) 만들기 Pandas란 panel datas(패널자료)의 약자로, 쉽게 사용 가능한 자료 구조이자 데이터 분석 툴을 말합니다. 1차원 자료: Series 이번에는 Pandas의 1차원 자료 구조인 Series에 대해 설명해보려 합니다. 먼저, 판다스의 모듈(라이브러리)를 호출합니다. import pandas as pd cs 판다스의 1차원 자료구조는 index와 value로 이루어져 있습니다. 기본 파이썬과의 차별점은 행을 row가 아닌 index로 칭한다는 점 입니다. 이제 본격적으로 시리즈를 생성해보겠습니다. 시리즈 만들기 : 1)List로 Series 만들기 1 2 3 animals = ['Tigers', 'Bears', 'Moose'] p = pd.Series(animals) p Colored by Col.. 2022. 3. 22.