Pandas란 panel datas(패널자료)의 약자로, 쉽게 사용 가능한 자료 구조이자 데이터 분석 툴을 말합니다.
1차원 자료: Series
이번에는 Pandas의 1차원 자료 구조인 Series에 대해 설명해보려 합니다.
먼저, 판다스의 모듈(라이브러리)를 호출합니다.
import pandas as pd
|
cs |
판다스의 1차원 자료구조는 index와 value로 이루어져 있습니다.
기본 파이썬과의 차별점은 행을 row가 아닌 index로 칭한다는 점 입니다.

이제 본격적으로 시리즈를 생성해보겠습니다.
시리즈 만들기 :
1)List로 Series 만들기
1
2
3
|
animals = ['Tigers', 'Bears', 'Moose']
p = pd.Series(animals)
p
|
cs |
결과값:
0 Tigers
1 Bears
2 Moose
dtype: object
2) Dictionary로 Series 만들기
key와 value 값을 입력하는 딕셔너리를 만들어줍니다.
이 때, key 값인 a, b, c가 index 명이 됩니다.
1
2
|
diction = {'a':1, 'b':2, 'c':3}
pd.Series(diction)
|
cs |
결과값:
a 1
b 2
c 3
dtype: int64
2차원 자료: DataFrame
DataFrame은 행과 열로 이루어진 자료구조입니다.
여기서 행은 axis = 0, 열은 axis = 1로 부릅니다.

데이터프레임과 시리즈의 다른점은 아래의 그림과 같이
여러 종류의 시리즈를 합쳐놓은 것이 데이터프레임이라고 생각하시면 구별하기 쉬우실 것이라 생각합니다.

데이터프레임 만들기 :
먼저, numpy를 import 해줍니다.
import numpy as np
|
cs |
1) Array로 DataFrame 만들기
이 경우에는 행(index)를 기준으로 dataframe이 생성됩니다.
1
2
|
arr = np.array([[1,2,3],[4,5,6]]) #값넣기
pd.DataFrame(arr)
|
cs |
결과값:
0 1 2
0 1 2 3
1 4 5 6
2) Dictionary로 DataFrame 만들기
이 경우에는 열(column)을 기준으로 생성된다는 것을 확인할 수 있습니다.
1
2
|
diction = {'a':[1,3], 'b':[1,2], 'c':[2,4]}
pd.DataFrame(diction)
|
cs |
결과값:
a b c
0 1 1 2
1 3 2 4
3) List로 DataFrame 만들기
List로 만들 때에도 열(column)을 기준으로 데이터가 생성됩니다.
1
2
|
li = [4,5,6,7]
pd.DataFrame(li)
|
cs |
결과값:
0
0 4
1 5
2 6
3 7
4) Series로 DataFrame 만들기
Series로 만들 때에는 행(index)를 기준으로 데이터가 생성됩니다.
1
2
3
|
lis = ['Tigers', 'Bears', 'Moose']
pd.Series(lis)
pd.DataFrame(lis)
|
cs |
결과값:
0
0 Tigers
1 Bears
2 Moose
'Python > Pandas, Numpy' 카테고리의 다른 글
[Pandas] DataFrame 행/열 이름 설정, 이름 변경, 삭제, 선택 (0) | 2022.05.31 |
---|