KNN算法

最新推荐文章于 2022-08-11 20:15:56 发布

zkywsg

最新推荐文章于 2022-08-11 20:15:56 发布

阅读量201

点赞数

文章标签：算法人工智能深度学习机器学习数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lauzanhing/article/details/105056201

版权

github完整深度学习相关整理

KNN概述

k最近邻,就是k个最近的邻居
一个样本在特征空间中的k个最近邻样本中大多数属于某一个类别/则该样本也属于这一个类别
所有的邻居都是已知类别的/而我们手上要进行分类的数据是不知道类别的

算法表述

计算测试数据和各个训练数据之间的距离
按照距离的递增关系进行排序
选择距离最小的k个点
确定前k个点所在类别的出现频率
返回前k个点中出现频率最高的类别作为测试数据的分类

K的取值

K:最邻近的每次计算点的个数
K太小:容易被噪点影响/比如k=1的时候/恰好这个数据是个噪点/那么就完全影响了这次分类
k太大:误差会增大/k最近邻做法的意义就变小了
k尽量取奇数/方便预测

距离怎么计算的

欧几里得距离: $E(x,y)=\sqrt{\sum_{i=1}^{n}(x_{i}-y_{i})^{2}}$
曼哈顿距离: $D(x,y)=|x_{i}-x_{j}|+|y_{i}-y_{j}|$

总结

knn是一个简单高效的分类算法并且容易实现
当训练集很大的时候/需要大量的存储空间/并且计算某个点和所有数据的距离是非常耗时的
对随机分布的数据分类效果差
对类内距离小/类间距离大的数据分类效果好
对样本不均匀的数据效果不好,可以进行权重改进,给近的测试点的权重更高
KNN非常耗时,所以比较适合小规模数据

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。