机器学习之K近邻算法--KNN

最新推荐文章于 2023-09-27 20:44:52 发布

l_sun_08

最新推荐文章于 2023-09-27 20:44:52 发布

阅读量515

点赞数

文章标签：机器学习 KNN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/l_sun_08/article/details/101050612

版权

KNN算法是解决分类问题的。
1.基本假设
越相近越相似
原则：少数服从多数，一点一票
2.算法原理
①算距离
给定测试对象 Item，计算它与训练集中每个对象的距离。
②找邻居
圈定距离最近的k个训练对象，作为测试对象的近邻。
③做分类
根据这k个近邻归属的主要类别，来对测试对象进行分类。
自邻居集合NN中取出前k名，查看它们的标签，对这k个点的标签求和，以多数决，得到可能类别。
3.距离类模型中距离的确认
k-NN算法基本思想我们已经知道了，其模型的表示形式是整个数据集。除了对整个数据集进行存储之外，k-NN没有其他模型。因此，k-NN不具有显式的学习过程，在做「分类」时，对新的实例，根据其 k 个最近邻的训练实例的类别，通过多数表决等方式进行预测。k-近邻法实际上利用了训练数据集对特征向量空间进行划分，并作为其分类的 “模型” 。
当特征数量有很多个形成多维空间时，再用上述的写法就不方便了，我们换一个写法，用 X 加下角标的方式表示
特征维度。则在n维空间中，有两个点 A 和 B，它们的坐标分别为：
在这里插入图片描述
则A和B两点之间的欧氏距离的基本计算公式如下：

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。