KUN算法
下面是对下面这张图的注解(kun算法的核心思想):
一个方框表示一个未知量(指左图中绿色的正方形),蓝色的三角形和红色的圆表示已经分好的值;
如果我想知道绿色的方框属于三角还是圆,就需要运用到kun算法,即根据离K最近的邻居来判断他,根据他周围的这几个值来判断他到底是哪一类;因为类似的一类总是在一个区域范围内。
KNN的原理就是当预测一个新的值x的时候,根据它距离最近的K个点是什么类别来判断x属于哪个类别。
(1)具体判断:如左图所示,在虚线圆圈内,有两个蓝色三角,一个红色圆;显而易见,当k=3时,正方体属于蓝色三角。
(2)算法规则:图中绿色的点就是我们要预测的那个点,假设K=3。那么KNN算法就会找到与它距离 最近的三个点(这里用圆圈把它圈起来了),看看哪种类别多一些,比如这个例子中 是蓝色三角形多一些,新来的绿色点就归类到蓝三角了
但k的值是可以随意变换的,比如,当k=5时,判定就变成不一样了(这次变成红圆多一些,所以新来的绿 点被归类成红圆。从这个例子中,我们就能看得出K的取值是很重要的),如下图所示: