[KNN(K-nearest neighbor) Algorithm]
KKN Algorithm은 기존에 가지고 있는 데이터를 바탕으로 새로운 점을 분류하는
알고리즘입니다.
예를 통해서 KNN Algorithm에 대해서 알아보도록 하겠습니다.
예) 점 분류하기
초록색 점을 파란 점이라고 분류 해야 할까요?
아니면 빨간 점으로 분류해야 할까요?
KKN 알고리즘은 그 점을 중심으로 동그라미를 그리고
그 안에 파란 점이 많은지 빨간 점이 많은지 세보는 것입니다.
만약 실선까지 센다고 하면 초록색 점은 빨간색으로 인식될 것이고
점선까지 센다면 파란색으로 인식될 것입니다.
K-nearest neighbor Algorithm에서 K가 의미하는 것은 위 예에서
점선과 실선의 원주와 같습니다.
즉, K는 범위를 말한다고 할 수 있습니다.
K에 의해 초록색 점이 분류되므로 K의 값을 어떻게 정의하느냐는 문제는 중요합니다.
위 방법이 회귀분석(regression analysis) 에도 이용될 수 있습니다.
첨부한 엑셀 시트를 보시면 됩니다.
출처 : http://gmpjs.blog.me/110093125375
[출처] K-Nearest Neighbor Classifier|작성자 운동화