KNN算法是数据分析中的一种常用方法。
本文对KNN算法的原理进行简要说明,并给出具体的应用示例。
原理
KNN算法根据样本之间的距离,进行类别的划分。
样本间的距离可以使用欧氏距离
d = ∑ i = 1 n ( x i − y i ) 2 d = \sqrt{\sum\limits_{i=1}^n(x_i - y_i)^2} d=i=1∑n(xi−yi)2
进行计算时,需要首先设定一个邻居数k=n。算法会判断距离选定样本值最近的n个样本值,分别计算他们与选定样本之间的距离,然后判断选定样本应该属于哪一类。
<