k-NearestNeighbor,翻译为K最近邻算法,是数据挖掘算法中最简单的一种算法。
我们先用一个例子体会下。
我们很容易知道,这些电影的类型,那么当有一部新电影出现的时候, 可不可以对其进行自动分类了?
我们可以把打斗次数看成 X 轴,接吻次数看成 Y 轴,然后在二维的坐标轴上,对这几部电影进行标记,如下图所示。
对于未知的电影 A,坐标为 (x,y),我们需要看下离电影 A 最近的都有哪些电影,这些电影中的大多数属于哪个分类,那么电影 A就属于哪个分类。实际操作中,我们还需要确定一个 K 值,也就是我们要观察离电影 A 最近的电影有多少个。
KNN 的工作原理
1、计算待分类物体与其他