kNN算法解析及应用【内附详细代码和数据集】

lingoMu

于 2019-03-12 21:51:33 发布

阅读量4.7k

点赞数 5

分类专栏： machine learning 数据挖掘文章标签： kNN 数据挖掘机器学习

本文链接：https://blog.csdn.net/lingoMu/article/details/88393314

版权

本文介绍了k近邻（kNN）算法的基本原理、优缺点以及适用数据类型。通过一个简单的欧氏距离例子，展示了kNN如何工作。接着，利用kNN算法改善约会网站的配对效果，数据集包含3个特征和3种标签类型。测试结果显示错误率为4.04%，并提供了数据集下载链接和参考文献。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

首先，我们需要了解什么是“kNN”

kNN英文全称k Nearest Neighbor，即k近邻算法。

用途：分类问题
kNN的工作原理：事先有一个有标签的样本数据集，然后输入没有标签的新数据后，将新数据的每个特征和样本集里的数据对应特征进行比较，最后算法提取样本集中特征最相似（最近邻）数据的分类标签。一般而言，只取k个最相似数据中出现次数最多的分类作为新数据的分类。
优点：精度高、对异常值不敏感、无数据输入假定。
缺点：计算复杂度高、空间复杂度高。
适用的数据范围：数值型和标称型。