Immersion In Data

AI

[AI] K-NN(K-Nearest Neighbor)

sungjunminn 2022. 8. 18. 10:03

1. K-NN

K-최근접 이웃(K-Nearest Neighbor) 알고리즘은 분류 알고리즘입니다. 비슷한 특성을 가진 데이터는 비슷한 범주에 속하는 경향이 있다는 가정하에 사용한다. 

 

 

위의 그림을 봤을 때, 세모 모양의 데이터는 주변에 노란색 그룹의 데이터들이 많이 때문에 노란색 그룹에 속한다고 추측할 수 있다. 이처럼 주변의 가장 가까운 K개의 데이터를 보고 데이터가 속할 그룹을 판단하는 알고리즘이 K-NN 알고리즘이다. 

 

 

K-NN 알고리즘은 거리를 측정할 때, 유클리드 거리(Euclidean distance)를 사용한다. 

K-NN알고리즘의 특징은 K의 값에 따라 분류가 달라질 수 있다는 점이다.  

위의 그림을 보면, K의 값이 1일 때는 초록색 그룹에 속한다고 볼 수 있고, K의 값이 3일 때는 노란색 그룹에 속한다고 볼 수 있다. 따라서 K-NN 알고리즘을 사용할 때, K의 값으 홀수로 설정하여 분류가 가능하도록 하는 것이 좋으며, 최선의 K를 선택하는 방법에 일반적으로 총 데이터 수의 제곱근 값을 사용한다. 

'AI' 카테고리의 다른 글

[AI] Random Forest  (0) 2022.08.19
[AI] Decision Tree  (0) 2022.08.18
[AI] Logistic Regression  (0) 2022.08.17
[AI] RBM(Restricted Boltzmann Machine)  (0) 2022.08.17
[AI] LSTM(Long Short Term Memory)  (0) 2022.08.16