KNN算法基础入门

最新推荐文章于 2024-01-17 23:17:20 发布

xiaoli_1

最新推荐文章于 2024-01-17 23:17:20 发布

阅读量246

点赞数

分类专栏： KNN 文章标签： KNN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiaoli_1/article/details/103002288

版权

KNN 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

KNN是一种基本的机器学习算法，所谓K近邻，就是k个最近的邻居。即每个样本都可以用和它最接近的k个邻近位置的样本来代替。

打个比方：通过KNN算法可以知道我是个怎样的人。具体做法就是分析我身边的朋友的属性，然后得出我的属性。
在这里插入图片描述
从上图中我们可以看到，一共三种数据类型，一类是蓝色的正方形，一类是红色的三角形，那个绿色的圆形是我们待分类的数据。 KNN算法就是判断绿色圆圈的数据类型。

如果K=3，那么离绿色点最近的有2个红色三角形和1个蓝色的正方形，这3个点投票，于是绿色的这个待分类点属于红色的三角形；
如果K=5，那么离绿色点最近的有2个红色三角形和3个蓝色的正方形，这5个点投票，于是绿色的这个待分类点属于蓝色的正方形。

KNN要素
k值的选择:
k越小，即使用较小的领域中的样本进行预测，训练误差会减小，但模型会很复杂，以至于过拟合。
k越大，即使用交大的领域中的样本进行预测，训练误差会增大，模型会变得简单，容易导致欠拟合。

ps：可以从K=1开始，逐步增加，用检验数据来分析正确率，从而选择最优K。这个结果要均衡考虑正确率与计算量，比如K=3时，正确率为90%，而K=10时，正确率为91%，则需要考虑计算量换来的1%提升是否合算了。

距离的度量:
使用欧几里得距离计算点之间的距离，公司如下：
在这里插入图片描述
（通过以上公式求得点之间的距离）

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
KNN算法基础入门

KNN是一种基本的机器学习算法，所谓K近邻，就是k个最近的邻居。即每个样本都可以用和它最接近的k个邻近位置的样本来代替。打个比方：通过KNN算法可以知道我是个怎样的人。具体做法就是分析我身边的朋友的属性，然后得出我的属性。从上图中我们可以看到，一共三种数据类型，一类是蓝色的正方形，一类是红色的三角形，那个绿色的圆形是我们待分类的数据。 KNN算法就是判断绿色圆圈的数据类型。如果K=3，那么...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。