K-近邻算法 概述:k-近邻算法采用测量不同特征之间的距离方法进行分类 优点:精度高、对异常值不敏感、无数据输入假定 缺点:计算复杂度高、空间复杂度高 使用数据范围:数值型和标称型 kNN的大概思路是这样的:对于给定的特征,特征都是由数字组成,可以看成是特征向量,如(x1,y1,z1),(x2,y2,z2)等,利用已知的数据(x,y,z)。计算已知数据和特征数据的欧式距离,距离越小证明相似度越高。这些最相似的特征的 特征标签就是预测的已知特征数据的标签