走进K近邻

最新推荐文章于 2023-05-27 13:55:11 发布

疯狂的小羊

最新推荐文章于 2023-05-27 13:55:11 发布

阅读量381

点赞数

分类专栏：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_19650093/article/details/50354067

版权

算法专栏收录该内容

7 篇文章 0 订阅

订阅专栏

K最近邻(k-Nearest Neighbour，KNN)分类算法的思路是：如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别，则该样本也属于这个类别。

k近邻算法的想法很简单，类似于多数表决，关键点是参与多数表决的人是离你最近的k个人。

给定一个实例，首先从训练集中找到离这个实例最近的k个实例，然后根据这k个实例中哪个标签出现次数最多决定该实例的标签。需要注意的点是：

a.距离的度量

b.k值得选取

c.存储和速度

度量距离有很多

距离度量（摘自李航《统计学习方法》）

对n维实数向量空间Rn，经常用Lp距离或曼哈顿Minkowski距离。

Lp距离定义如下：

当p=2时，称为欧氏距离：

当p=1时，称为曼哈顿距离：

当p=∞，它是各个坐标距离的最大值，即：

用图表示如下：

K值选择

选择较小的K值，近似误差会减小，估计误差会增大，意味着整体模型变得复杂，容易发生过拟合；
选择较大的K值，减少估计误差，近似误差会增大，K值的增大就意味着整体的模型变得简单。
在实际应用中，K值一般取一个比较小的数值，例如采用交叉验证法（一部分样本做训练集，一部分做测试集）来选择最优的K值。

分类决策规则

k近邻法中的分类决策规则往往是多数表决，即由输入对象的k个邻近中的多数类决定输入对象的类，通俗点就是“少数服从多数”

资料参考：

http://wenku.baidu.com/link?url=L74R5Bowp9woQq9S-SsloSvd0thzcSl7TD0iihpdmcGcdrOZlaLXqox3_5PUTIMY3UHySsFErSASUXelCWnhjLiCGYYizX_Md_p6FE1H-L3《百度文库资料，非常详细》

李航《统计学习方法》

http://www.hankcs.com/ml/k-nearest-neighbor-method.html

疯狂的小羊

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
走进K近邻

K最近邻(k-Nearest Neighbour，KNN)分类算法的思路是：如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别，则该样本也属于这个类别。k近邻算法的想法很简单，类似于多数表决，关键点是参与多数表决的人是离你最近的k个人。给定一个实例，首先从训练集中找到离这个实例最近的k个实例，然后根据这k个实例中哪个标签出现次数最多决定该实例的标签
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。