KNN算法

最新推荐文章于 2023-06-18 11:33:00 发布

cx_zz

最新推荐文章于 2023-06-18 11:33:00 发布

阅读量247

点赞数

文章标签：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_61169431/article/details/126288736

版权

1. 算法介绍

KNN可以说是最简单的分类算法之一，同时，它也是最常用的分类算法之一

KNN的全称是K Nearest Neighbors，意思是K个最近的邻居。K个最近邻居，K的取值肯定是至关重要的。KNN的原理就是当预测一个新的值x的时候，根据它距离最近的K个点是什么类别来判断x属于哪个类别。

图中绿色的点就是我们要预测的那个点，假设K=3。那么KNN算法就会找到与它距离最近的三个点（这里用圆圈把它圈起来了），看看哪种类别多一些，比如这个例子中是蓝色三角形多一些，新来的绿色点就归类到蓝三角了。

2. 距离计算

二维空间两个点的欧式距离计算公式如下：

计算（x1,y1）和（x2,y2）的距离。拓展到多维空间，则公式变成这样：

KNN算法就是将预测点与所有点距离进行计算，然后保存并排序，选出前面K个值看看哪些类别比较多。

3. 交叉验证选取k值

通过交叉验证计算方差后你大致会得到下面这样的图：

在许多实际应用中数据是不充足的。为了选择好的模型，可以采用交叉验证方法。交叉验证的基本想法是重复地使用数据，把给定的数据进行切分，将切分的数据组合为训练集与测试集，在此基础上反复进行训练测试以及模型的选择。

你增大k的时候，一般错误率会先降低，因为有周围更多的样本可以借鉴了，分类效果会变好。但注意，和K-means不一样，当K值更大的时候，错误率会更高。这也很好理解，比如说你一共就35个样本，当你K增大到30的时候，KNN基本上就没意义了。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
KNN算法

KNN
复制链接

扫一扫

cx_zz CSDN认证博客专家 CSDN认证企业博客

码龄3年

25: 原创

57万+: 周排名

66万+: 总排名

1万+: 访问

: 等级

263: 积分

5: 粉丝

8: 获赞

6: 评论

4: 收藏

私信

关注

热门文章

最新评论

卷积神经网络
石头dhf: 介绍的通俗易懂。赞一个。你的文章里的图哪里来的啊？
Harmonyos入门
Anna&: 期望有后续的进阶更新
Harmonyos入门
Edice: 小窍门get√

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。