9. K近邻算法 KNN

最新推荐文章于 2023-10-09 20:24:57 发布

VIP文章 n不正

最新推荐文章于 2023-10-09 20:24:57 发布

阅读量847

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/qq_30981697/article/details/71807673

版权

KNN算法也是经典的机器学习算法之一。本节对这个算法做一个简单的介绍。

KNN是K-Neighbor Nearest的缩写，顾名思义，就是要寻找到距离最近的k个点。如果是分类问题，将该点分类为这k个点钟最多的那一类；如果是回归问题，预测值为这k个点的均值。
KNN算法是一个十分简洁容易解释的模型，并且只有k一个参数，这是它的优点。相反的，它也有很多的缺点，比如计算复杂度非常高，并且算法占用的内存很大。这个算法在训练的时候非常容易，就好比一个平常不好好学习的学生，到了考试就开始临时抱佛脚。KNN算法每预测一个测试数据就需要针对训练样本进行一次遍历，因此它的算法复杂度可以达到平方级别。
在下图中，假设红色的三角形和蓝色的正方形已经被正确分类，现在我们需要预测绿色圆的分类。依照knn的规则，当我们取k=3时，显然被分类为红三角；当我们取k=5时，被分类为蓝正方形。可以看到，k的取值是对最终的预测结果有较大影响的。

关注