机器学习--day6--KNN

最新推荐文章于 2024-06-14 10:39:52 发布

言沫341

最新推荐文章于 2024-06-14 10:39:52 发布

阅读量34

点赞数 1

文章标签：学习方法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_67479809/article/details/130837097

版权

K近邻算法简介

K近邻（K-Nearest Neighbor，KNN) 算法是一个典型的监督学习算法核心思想是：未标记样本的类别由距离其最近的K个邻居通过投票来决定。具体而言，假设存在一个已经标记好的数据集。给定一个未标记的数据样本，我们的任务是：预测出该数据样本所属的类别。KNN的原理是：计算待标记样本和数据集中每个样本的距离取距离最近的K个样本待标记的样本所属类别由这K个距离最近的样本投票产生。

K近邻算法

k-近邻算法，其工作机制就是给定测试样本，基于某种距离度量找出训练集中与其最靠近的k个训练样本，然后基于这k个“邻居”的信息来进行预测。

k近邻法会涉及到三个问题（三要素）：距离度量、k 值的选择、分类决策规则

距离度量

特征空间的两个实例点的距离度量是两个实例点相似程度的反映。距离小，那么相似度大；距离大，那么相似度小。k-近邻模型的特征空间一般是n维实数向量空间R^n 。使用的距离是欧式距离，但也可以是其他距离，如更一般的L_p距离（L_p distance）或Minkowski距离。

欧氏距离(Euclidean distance) 是最常用的距离计算公式，衡量的是多维空间中各个点之间的绝对距离。欧在二维和三维空间中的欧氏距离就是两点之间的实际距离。

曼哈顿距离(Manhattan distance)从一个十字路口开车到另外一个十字路口实际驾驶距离就是这个“曼哈顿距离”。无论哪条路线，距离一样。

k值的选择

一般是靠经验，默认为5个

k值较大，会使模型变得简单，容易欠拟合

k值较小，会使模型变得复杂，容易过拟合

分类决策

未知实例的k个近邻的多数实例类决定未知实例类，经验风险最小化

算法流程如下：

1.计算测试对象到训练集中每个对象的距离

2.按照距离的远近排序

3.选取与当前测试对象最近的k的训练对象，作为该测试对象的邻居

4.统计这k个邻居的类别频次

5.k个邻居里频次最高的类别，即为测试对象的类别

KNN算法的优点

1.即可用于回归也可用于分类

2.理论成熟，思想简单

3.重新训练代价低

4.对异常值不敏感

缺点

大训练集内寻找最近邻花费的时间大。

对内存要求较高，该算法存储了所有的训练数据

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
机器学习--day6--KNN

K近邻（K-Nearest Neighbor，KNN) 算法是一个典型的监督学习算法核心思想是：未标记样本的类别由距离其最近的K个邻居通过投票来决定。KNN的原理是：计算待标记样本和数据集中每个样本的距离取距离最近的K个样本待标记的样本所属类别由这K个距离最近的样本投票产生。使用的距离是欧式距离，但也可以是其他距离，如更一般的L_p距离（L_p distance）或Minkowski距离。欧氏距离(Euclidean distance) 是最常用的距离计算公式，衡量的是多维空间中各个点之间的绝对距离。
复制链接

扫一扫

言沫341 CSDN认证博客专家 CSDN认证企业博客

码龄2年

16: 原创

135万+: 周排名

188万+: 总排名

936: 访问

: 等级

218: 积分

2: 粉丝

19: 获赞

18: 评论

1: 收藏

私信

关注

热门文章

最新评论

机器学习--day9--决策树整个流程
CSDN-Ada助手: 恭喜您写了第10篇博客，标题看起来非常有意思！看来您对机器学习的掌握越来越深入了。下一步建议可以考虑分享一些实际案例，让读者更好地理解决策树的应用场景和效果。期待您的下一篇文章！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply10 看奖励名单。
day8－－决策树－－介绍
CSDN-Ada助手: 恭喜您写了第9篇博客，标题为“day8－－决策树－－介绍”。作为读者，我感到非常兴奋，因为您的文章内容非常有趣和富有启发性。我非常期待您未来的创作，希望您可以继续分享更多关于机器学习和数据科学的知识，并且在文章中给出更多的实践案例和技巧。谢谢您的分享！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply9 看奖励名单。
机器学习--day7--NB算法
CSDN-Ada助手: 非常感谢您的不懈努力，写了这么多篇博客，尤其是这篇关于NB算法的分享。您的文章非常清晰明了，让我对这个算法有了更深入的了解。希望您能继续保持这种热情和创造力，分享更多有关机器学习的知识。同时，如果您能在博客中加入一些实际案例的应用和实验结果的解读，那将会更加生动有趣。再次感谢您的付出。 CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply8 看奖励名单。
机器学习--day7--NB算法
言沫341:
机器学习--day7--NB算法
上仙好运来: 不要忘记每天

大家在看

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。