kNN-k近邻算法

最新推荐文章于 2024-03-05 16:58:47 发布

Leo_Black

最新推荐文章于 2024-03-05 16:58:47 发布

阅读量528

点赞数

分类专栏：机器学习算法文章标签： kNN AI 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Leo_Black/article/details/85268616

版权

机器学习算法专栏收录该内容

2 篇文章 0 订阅

订阅专栏

KNN-k近邻算法

k近邻学习简介
实施kNN算法步骤
优点
缺点
适用数据范围

k近邻学习简介

如下是西瓜书里面的介绍：
k 近邻 (k-Nearest Neighbor，简称 kNN )学习是一种常用的监督学习方法，
其工作机制非常简单: 给定测试样本?基于某种距离度量找出训练集中与其最
靠近的 k 个训练样本，然后基于这 k 个"邻居 “的信息来进行预测 . 通常，在分
类任务中可使用"投票法” 即选择这 k 个样本中出现最多的类别标记作为预
测结果;在回归任务中时使用"平均法" ，即将这 k 个样本的实值输出标记的
平均值作为预测结果;还可基于距离远近进行加权平均或加权投票，距离越近
的样本权重越大. ------ 《机器学习》周志华
个人理解是，物以类聚，“距离”正是样本的特征属性相似度的度量，一个样本的分类和他周边k个最近样本中数量最多的一类是同类的概率最大。
距离：这个距离是指欧氏距离
K的含义就是和预测样本的距离最小的有标记样本的数量。

实施kNN算法步骤

计算已知类别数据集中的点与当前点之间的距离（整个训练集都要计算）
按照距离递增次序排序
选取与当前距离最小的k个点
确定k个点所在类别的出现频率
返回前k个点出现频率最高的类别作为当前点的预测分类
如上步骤可知，整个kNN算法的实施过程中并没有‘学习’的过程，直接依据训练集的样本做出预测。
算法调参就是调的这个K

优点

简单有效、精度高、对异常值不敏感、无数据输入假定
西瓜书有推导，得到一个结论：kNN虽简单，但它的泛化错误率不超过贝叶斯最优分类器的两倍。

缺点

计算复杂读高、空间复杂度高，原因就是每次预测都要把整个训练集都算一遍，特征数、样本数一增加计算量大幅度上升；
没有特征偏好，特征属性会等同偏好地参与到评估预测中。

适用数据范围

数值型和标称型（类似于枚举类别这样的，如true和false）

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
kNN-k近邻算法

KNN-k近邻算法k近邻学习简介实施kNN算法步骤优点缺点适用数据范围k近邻学习简介如下是西瓜书里面的介绍：k 近邻 (k-Nearest Neighbor，简称 kNN )学习是一种常用的监督学习方法，其工作机制非常简单: 给定测试样本?基于某种距离度量找出训练集中与其最靠近的 k 个训练样本，然后基于这 k 个&amp;quot;邻居 “的信息来进行预测 . 通常，在分类任务中可使用&amp;quot;投...
复制链接

扫一扫

专栏目录

Leo_Black CSDN认证博客专家 CSDN认证企业博客

码龄7年

6: 原创

36万+: 周排名

61万+: 总排名

1万+: 访问

: 等级

205: 积分

1: 粉丝

5: 获赞

3: 评论

39: 收藏

私信

关注

热门文章

分类专栏

最新评论

xlnt库
风来浪也白头_: 为什么我这里程序执行时一直卡在 load这里啊，没报错没崩溃，谢谢啦
ros2编程入门
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
xlnt库
孤独时代的你: 你好请问xInt可以读取中文名称的表格吗，我读取的时候好像不支持

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。