机器学习算法之--KNN总结

最新推荐文章于 2024-01-21 16:18:30 发布

努力努力再努力F_

最新推荐文章于 2024-01-21 16:18:30 发布

阅读量687

点赞数

分类专栏：机器学习算法进阶之路

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39751437/article/details/86133047

版权

本文详细介绍了KNN（K-近邻）算法的数学原理，包括K值选择、分类决策规则和距离度量方式。讨论了KD树作为提高搜索效率的数据结构，并提供了Python代码示例，包括sklearn库的使用和深度学习方法。最后总结了模型参数调优和K值选择的重要性，以及KNN算法的相关参数解释。

摘要由CSDN通过智能技术生成

文章目录

一、数学原理
二、代码实现
三、总结

一、数学原理

KNN 是一种分类与回归方法，属于监督学习一种。确定了KNN三要素，待预测点的分类也唯一确定。K-近邻模型基于对训练数据集特征空间的划分

优点：精度高、对异常值不敏感、无数据输入假定。
缺点：计算复杂度高、空间复杂度高。适用数据范围：数值型和标称型。

（1）KNN三个基本要素

K值
K较大，会减少估计误差，增大近似误差，模型简单，近似误差越小，训练误差越小。
K较小，会增大近似误差，减少估计误差，估计误差越小，测试误差越小。模型复杂，容易过拟合。
通常采用交叉验证方法来选取K值
分类决策规则
通常用少数服从多数方法来决定待预测的类别，即给定K值和距离度量方式后，选取区域内离待分类点最近的K个目标，这些选定目标中类别出现最多的为待预测点的类别。分类决策规则对应于经验风险最小化。
距离度量方式选择
通常有两种，欧几里得距离，曼哈顿距离，注意，不同距离度量方式选取的近邻点不同

（2）KD树
k近邻法最简单的实现方法是线性扫描（linear scan），这时要计算输入实例与每一个训练实例的距离，当训练集很大时，计算非常耗时。为

最低0.47元/天解锁文章

努力努力再努力F_

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。