分类算法学习之KNN算法（一）理论基础

最新推荐文章于 2024-06-19 14:40:49 发布

小码良

最新推荐文章于 2024-06-19 14:40:49 发布

阅读量2.3k

点赞数 1

分类专栏：机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zll_1234/article/details/105405722

版权

本文介绍了KNN（K最近邻）算法的基本原理，包括其作为监督学习的性质，算法流程，特别是K值的选择及其对模型复杂度的影响。文章详细阐述了点距离的计算方法和特征归一化的必要性，并探讨了KNN算法在文本分类、用户推荐等领域的适用场景以及优缺点。KNN算法依赖于训练数据集，通过计算新实例与已有实例的距离来决定分类，K值的选择直接影响预测结果的准确性。

摘要由CSDN通过智能技术生成

KNN算法

1、算法原理

属于监督学习。
KNN（K Nearest Neighbors）根据全称我们可以从字面上了解，K个最近的邻居。K个最近邻居，毫无疑问，K的取值肯定是至关重要的。
KNN算法的原理：预测一个新的值x，根据它距离最近的K个点是什么类别来判断x属于哪个类别。

在这里插入图片描述
如上图所示，有两类不同的样本数据，分别用蓝色的小正方形和红色的小三角形表示，而图正中间的那个绿色的圆所标示的数据则是待分类的数据。这也就是我们的目的，来了一个新的数据点，我要得到它的类别是什么？好的，下面我们根据k近邻的思想来给绿色圆点进行分类。

如果K=3，绿色圆点的最邻近的3个点是2个红色小三角形和1个蓝色小正方形，少数从属于多数，基于统计的方法，判定绿色的这个待分类点属于红色的三角形一类。
如果K=5，绿色圆点的最邻近的5个邻居是2个红色三角形和3个蓝色的正方形，还是少数从属于多数，基于统计的方法，判定绿色的这个待分类点属于蓝色的正方形一类。

从上面例子我们可以看出，k近邻的算法思想非常的简单，也非常的容易理解，那么我们是不是就到此结束了，**该算法的原理我们也已经懂了，也知道怎么给新来的点如何进行归类，只要找到离它最近的k个实例，哪个类别最多即可。**还没有结束，比如k怎么确定的，k为多少效果最好呢？所谓的最近邻又是如何来判断给定呢？看下文

2、算法流程

2.1、输入：

训练数据集T=(x1,y1),(x2,y2),…,(xN,yN)
（其中，xi∈X⊆Rn为实例的特征向量，yi∈Y={c1,c2,…,ck}为实例的类别，i=1,2,…,N；实例特征向量x）

2.2、输出：实

最低0.47元/天解锁文章

关注

1
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
分类算法学习之KNN算法（一）理论基础

KNN算法1、算法原理属于监督学习。KNN（K Nearest Neighbors）根据全称我们可以从字面上了解，K个最近的邻居。K个最近邻居，毫无疑问，K的取值肯定是至关重要的。KNN算法的原理：预测一个新的值x，根据它距离最近的K个点是什么类别来判断x属于哪个类别。2、算法流程2.1、输入：训练数据集T=(x1,y1),(x2,y2),…,(xN,yN)（其中，xi∈X⊆Rn为...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。