下面用最简洁的话语说明 kNN 算法:
kNN 算法(K 近邻算法)是一种分类算法,即对于给出的一条待分类的数据或待分类的一个东西,我们提取出这条数据的特征值;按照特征值,通过计算与已经分好类的所有条数据之间的一一欧式距离,把这些所有欧式距离排序,挑选出K个最短的距离;对于这K个最短的距离所对应的已经分好类的K个数据,按类别选出出现次数最多的数据们的类别。那么,knn算法就判定,这个类别就是待分类数据或东西的类别。
注意:
1,每一条数据的特征值一般有多个,不同的特征值其单位和大小可能不一样,为了等权重考虑计,计算距离时,一般要每个特征值进行归一化数值操作,即每种特征值的最大值为1。
2, kNN算法的优缺点: