본문 바로가기
Python/Pandas, Numpy

Pandas - 1차원 자료 (Series), 2차원 자료(DataFrame) 만들기

by IT두잇 2022. 3. 22.

Pandas란 panel datas(패널자료)의 약자로, 쉽게 사용 가능한 자료 구조이자 데이터 분석 툴을 말합니다. 

 

1차원 자료: Series

이번에는 Pandas의 1차원 자료 구조인 Series에 대해 설명해보려 합니다. 

 

먼저, 판다스의 모듈(라이브러리)를 호출합니다. 

import pandas as pd
cs

 

판다스의 1차원 자료구조는 index와 value로 이루어져 있습니다.

기본 파이썬과의 차별점은 행을 row가 아닌 index로 칭한다는 점 입니다. 

https://codechalleng.es/

 

이제 본격적으로 시리즈를 생성해보겠습니다. 

 

시리즈 만들기 :

1)List로 Series 만들기

1
2
3
animals = ['Tigers''Bears''Moose']
= pd.Series(animals)
p
cs

결과값:

0      Tigers

1      Bears

2      Moose

dtype: object

 

 

2) Dictionary로 Series 만들기

key와 value 값을 입력하는 딕셔너리를 만들어줍니다.

이 때, key 값인 a, b, c가 index 명이 됩니다.

1
2
diction = {'a':1'b':2'c':3}
pd.Series(diction)
cs

결과값:

a    1
b    2
c    3
dtype: int64

 


2차원 자료: DataFrame

DataFrame은 행과 열로 이루어진 자료구조입니다. 

여기서 행은 axis = 0, 열은 axis = 1로 부릅니다. 

stackoverflow.com/

 

데이터프레임과 시리즈의 다른점은 아래의 그림과 같이

여러 종류의 시리즈를 합쳐놓은 것이 데이터프레임이라고 생각하시면 구별하기 쉬우실 것이라 생각합니다. 

www.learndatasci.com/

 

 

데이터프레임 만들기 :

먼저, numpy를 import 해줍니다. 

import numpy as np
cs

 

1) Array로 DataFrame 만들기

이 경우에는 행(index)를 기준으로 dataframe이 생성됩니다. 

1
2
arr = np.array([[1,2,3],[4,5,6]]) #값넣기
pd.DataFrame(arr) 
cs

결과값:

   0  1  2
0  1  2  3
1  4  5  6

 

 

2) Dictionary로 DataFrame 만들기

이 경우에는 열(column)을 기준으로 생성된다는 것을 확인할 수 있습니다. 

1
2
diction = {'a':[1,3], 'b':[1,2], 'c':[2,4]} 
pd.DataFrame(diction) 
cs

결과값:

   a  b  c
0  1  1  2
1  3  2  4

 

 

3) List로 DataFrame 만들기

List로 만들 때에도 열(column)을 기준으로 데이터가 생성됩니다. 

1
2
li = [4,5,6,7]
pd.DataFrame(li)
cs

결과값:

   0
0  4
1  5
2  6
3  7​

 

 

4) Series로 DataFrame 만들기

Series로 만들 때에는 행(index)를 기준으로 데이터가 생성됩니다. 

1
2
3
lis = ['Tigers''Bears''Moose']
pd.Series(lis)
pd.DataFrame(lis)
cs

결과값:

        0
0  Tigers
1   Bears
2   Moose