[KNN(K-nearest neighbor) Algorithm]

KKN Algorithm은 기존에 가지고 있는 데이터를 바탕으로 새로운 점을 분류하는 

알고리즘입니다.


예를 통해서 KNN Algorithm 대해서 알아보도록 하겠습니다.


 분류하기





초록색 점을 파란 점이라고 분류 해야 할까요

아니면 빨간 점으로 분류해야 할까요?

KKN 알고리즘은  점을 중심으로 동그라미를 그리고 

 안에 파란 점이 많은지 빨간 점이 많은지 세보는 것입니다.

만약 실선까지 센다고 하면 초록색 점은 빨간색으로 인식될 것이고

점선까지 센다면 파란색으로 인식될 것입니다.


K-nearest neighbor Algorithm에서 K 의미하는 것은  예에서 

점선과 실선의 원주와 같습니다.

즉, K는 범위를 말한다고 할 수 있습니다.

 K 의해 초록색 점이 분류되므로 K 값을 어떻게 정의하느냐는 문제는 중요합니다.

 

 방법이 회귀분석(regression analysis) 에도 이용될  있습니다 

첨부한 엑셀 시트를 보시면 됩니다.


출처 : http://gmpjs.blog.me/110093125375


Posted by 모과이IT
,