본문 바로가기

전체 글24

[파이썬] 데이터 전처리 진행하기 데이터에 결측치가 있을 경우 전처리를 진행합니다. 학생들의 gpa를 정리한 데이터를 활용해보았습니다. import tensorflow as tf from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense import pandas as pd import numpy as np data = pd.read_csv('D:/Python/data/gpascore.csv') print(data) 결과값: 결측 데이터 전처리 - 데이터 내부에 결측값이 있어서 결측치 처리를 진행하는 다양한 방법을 알아보았습니다. 결측치 개수 확인: isnull( ).sum( ) - 개수를 확인해보니 gre 열에 1개의 결측값이 있는 것이 .. 2022. 5. 17.
[딥러닝] CNN을 통한 이미지 학습 분류 CNN(Convolution Neural Network)이란? 비정형 데이터를 다루는 방법 중의 하나로, 이미지 학습에 뛰어난 딥러닝 모델입니다. 데이터의 특징을 추출하여 특징들의 패턴을 파악하고 예측값과 정답을 비교, weight, bias 값을 업데이트해서 학습을 반복하는 과정을 거칩니다. 이번 시간에도 mnist 데이터를 활용해 분석을 진행해 보았습니다 :) ~ import pandas as pd df = pd.read_csv('mnist_train.csv') 1. 라이브러리 설치 import numpy as np import tensorflow as tf #tensorflow 기본 from tensorflow.keras.models import Sequential #모델 box 정의 from te.. 2022. 5. 17.
[Tensorflow] Keras를 통한 딥러닝 (ANN - 인공신경망) 이번에는 mnist data를 활용해보려고 합니다 :) mnist는 숫자 0부터 9까지의 이미지로 구성된 손글씨 데이터 셋입니다. Tensorflow를 설치하고 데이터 정규화를 위해 MinMaxScaler를 import 합니다. import tensorflow as tf from sklearn.preprocessing import StandardScaler, MinMaxScaler mnist 데이터 셋을 불러옵니다. mnist = tf.keras.datasets.mnist train과 test 데이터 셋 분리 (x_train, y_train), (x_test, y_test) = mnist.load_data() 정규화 : 정규화는 모델의 정확도를 높이기 위해 필요한 작업입니다. - 최댓값으로 나누기 - e.. 2022. 5. 13.
KoNLPy 설치 및 한국어 형태소 라이브러리 비교 KoNLPy 라이브러리를 통해 총 5가지 종류의 형태소 분석기를 활용할 수 있습니다. 이 중 Okt, 한나눔, 꼬꼬마 라이브러리를 비교해보려 합니다 :) KoNLPy 라이브러리 설치 방법 1. 아나콘다에서 설치되어 있는지 확인 >> conda install konlpy 2. 설치 >> pip3 install konlpy Okt, 한나눔, 꼬꼬마 라이브러리는 다음과 같은 메서드를 공통적으로 제공합니다. .pos( ) : 품사 부착 결과값 예시: [('아버지', 'Noun'), ('가방', 'Noun'), ('에', 'Josa'), ('들어가신다', 'Verb')] .morphs( ) : 형태소 추출 결과값 예시: ['아버지', '가', '방', '에', '들어가신다'] .nouns( ): 명사 추출 결과값.. 2022. 4. 29.