算法介绍
对于分类问题,常用的思想就是根据数据的相似度来进行分类。而评价是否相似的一种方法就是计算它们之间的距离。
如果使用最近邻(只找一个最近的数据) 来判断类别,会在一个明显的不足。就是噪声的影响。如果最近的那个数据是噪声数据,那么分类就会出错。所以我们找k个近邻的数据来判断类别。
算法三要素
实现方式
蛮力实现
用于数据量比较少的时候, 注意:
对于分类问题,常用的思想就是根据数据的相似度来进行分类。而评价是否相似的一种方法就是计算它们之间的距离。
如果使用最近邻(只找一个最近的数据) 来判断类别,会在一个明显的不足。就是噪声的影响。如果最近的那个数据是噪声数据,那么分类就会出错。所以我们找k个近邻的数据来判断类别。
用于数据量比较少的时候, 注意: