算法：KNN算法

最新推荐文章于 2022-04-25 14:27:27 发布

Genius!

最新推荐文章于 2022-04-25 14:27:27 发布

阅读量252

点赞数 1

分类专栏：机器学习与算法文章标签：算法机器学习 sklearn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/GeniusLS/article/details/119941331

版权

机器学习与算法专栏收录该内容

7 篇文章 0 订阅

订阅专栏

KNN（K-NearestNeighbor）是一种简单的机器学习分类算法，基于新点与其最近K个邻居的距离进行分类。K值的选择影响分类结果，小K值可能导致过拟合，大K值则可能使算法失去意义。距离通常用欧式距离计算，但也有其他方式。KNN算法在大数据量时适用，但内存需求高且时间复杂度较高。

摘要由CSDN通过智能技术生成

KNN 全称（K-Nearest Neighbor），意为最近的K个邻居，是一种简单方便的机器学习分类算法。

KNN算法

原理：当新加入一个点，来计算离他最近的K个点，根据这K个点的类型数量对新加入的点进行分类。

而这个k的取值对于KNN算法来说至关重要！

如图所示：图中有蓝红两个类型，其中黑点是新加入的点，接下来我们来看看KNN算法如何为他进行分类。

当K=3时：黑点圈中有两个红色三角形，一个蓝色正方形，由此可以看出来黑点属于红色三角类型

当K=5时：黑点圈中有两个红色三角形，四个蓝色正方形，由此可以看出来黑点属于蓝色正方形类型

距离计算

KNN算法通常用欧式距离进行距离计算（当然有时候也会用曼哈顿距离，切比雪夫距离来算）：

二维空间距离计算

二维空间欧式距离

多维空间距离计算

多维空间欧式距离

通过距离计算后，我们对点进行分类，也可以使用堆来对分类的点进行存储，方便分类。

K值选择

如果K值选择的过于小，则会导致过拟合，误差很大，随着K值增大错误率会降低，周围有更多的样本供你借鉴，但是K值越发增大就会导致K值接近样本值，KNN就失去了意义，错误率也将直线上升，重要的是找到K曲线的临界点。

如图所示~~（别人的图）~~：

K值与Error

KNN的优缺点

优点：

① 简单易用

② 对异常值不敏感（只看分类数量）

③ 效果好，精确度高

缺点：

① 对计算机内存要求高，所有数据由该算法存储

② 时间复杂度高（可以用KDtree解决）

何时该选？

当需要分类算法且数据量要求很大时选择KNN算法！

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。