Machine Learning

KNN - K-Nearest Neighbo 로 데이터 분류하기

yugyeong 2022. 12. 2. 14:20

 

KNN 은 차트상에서 가장 가까운 데이터 를 가지고 분류 하는 방법이다.

 

 

 

 

피쳐스케일링과 X와 y 데이터를 훈련과 테스트 데이터로 분류했다고 가정하고, KNN 인공지능으로 분류하는 방법을 작성하겠다.

 

from sklearn.neighbors import KNeighborsClassifier

먼저 KNN 인공지능으로 분류하기 위해서 필요한 라이브러리를 임포트 해준다.

 

변수 classifier 에 KNeighborsClassifier() 을 저장해준 후 fit() 함수를 이용하여 인공지능을 학습시켜준다.

 

 

from sklearn.neighbors import KNeighborsClassifier
classifier = KNeighborsClassifier()
classifier.fit(X_train, y_train)

 

 

학습된 인공지능에 predict 함수를 이용하여 X_test 값에 대해서 결과값을 예측하도록 시킨다

예측한 결과값은 변수 y_pred 에 저장한다.

 

confusion_matrix, accuracy_score 를 이용하여서 y_test 와 y_pred 의 값을 비교하여 정확도를 계산한 결과이다

 

y_pred = classifier.predict(X_test)
y_pred
y_test.values
from sklearn.metrics import confusion_matrix, accuracy_score
cm = confusion_matrix(y_test, y_pred)
cm
accuracy_score(y_test, y_pred)