一、是什么 寻找最近的k个数据,推车新数据的分类。 二、算法原理 通用步骤: 1.计算距离(常用欧几里得距离(平方和开方)或马氏距离) 2.升序排列 3.取前k个 4.加权平均k的选取 1.k太大:导致分类模糊 2.k太小:受个例影响,波动较大如何选取k 1.经验 2.均方根误差 三、实现 测试数据: 读取数据分组:部分作为测试,部分作为实验(如果分多少,则建议random一下,避免耦合性) knn ①距离(欧几里得距离) ②实现knn:求距离、排序(升序)、取前K个、加权平均。 测试阶段: