非常简单！一文让你秒懂k最近邻算法

最新推荐文章于 2024-08-11 22:50:26 发布

wulishinian

最新推荐文章于 2024-08-11 22:50:26 发布

阅读量1.3k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wulishinian/article/details/105966668

版权

分类是人类时时刻刻在做的事情，比如我们收拾孩子的玩具的时候，需要辨认哪个是“玩沙子套装”的成员、哪些是图书，然后分类存放。

一些比较懒的人，希望让生活中尽量多的事情自动化。比如一个哥们，构建了一个分类装置，将两吨的乐高积木按照颜色、形状做了分类。分类装置的核心是一个训练好的神经网络。分类算法在生产和生活里的用处不止于此。

神经网络挺好的，本文介绍一下k最近邻算法（k-Nearest neighbor,kNN）。kNN是我确信自己学明白的第一个分类算法，它非常简单。

1kNN分类算法简介

1.1kNN分类算法的思想

kNN算法认为，具体的事物之间存在一定的相似性。举个例子，假设我和一只大熊猫的相似度是s1，我和赵本山的相似度是s2。除非大家抬杠，综合身高体重毛发等等特征，我和本山大叔显然更相似，即 s1< s2。

kNN算法认为，如果一个待分类样本，与类别（假设是A类）的代表性样本最像，相似程度超过了其他类别的代表性样本，那么，我们可以判定待分类样本的类别为A。

当然，实际操作的时候，我们用“距离”的远近来表示相似程度的大小：距离越远，相似度越低；距离越近，相似度越高。

1.2kNN算法的最简单形态-NN算法

假设我们要将10000个生物分为(人类，动物)两类，如果用最近邻算法(Nearest neighbor, NN)来完成这个任务，步骤是：

（1）请专家挑选1个人类(A类)， 1个动物(B类)；

（2）对于第i个生物，我们计算它与那个人类的距离，以及它与那个动物的距离，然后看那个距离更小，对应的类别就是这个生物的类别;

（3）重复(2)步，直到对所有生物分类完毕。

前面我们用纯语言的方式描述这个算法，对一些人比较合适，接下来用图形介绍一下，如图1-1。分类器会计算我离赵本山更近一点，还是离大熊猫更近一点，然后以离我更近的赵本山的类别，作为我的类别。

有的人看图学得快，有的人看文字学得快，有的人看公式学得快，大家平时可以注意一下哪种是最适合的。后面我们会有公式。

最低0.47元/天解锁文章

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。