K近邻算法总结 实例流程、 数据的处理分割数据集对数据集进行标准化estimetor流程进行分类预测 问题 k值取多大 有什么影响 k值取很小时;容易受异常点影响K值取很大时 :容易受k值类别波动 性能问题? 样本量大时运算时间长 优缺点 优点 简单易于理解,易于实现,无需估计参数,无需训练 缺点 懒惰算法,对测试样本分类时的计算量大,内存开销大必须指定k值,k值选择不当则分类精度不能保证 使用场景:小数据场景,几千~几万样本,具体场景具体业务去测试