(RPA学习)——机器学习篇 1-k 近邻算法基础（KNN 算法）

艺赛旗RPA

于 2019-07-01 15:46:29 发布

阅读量459

点赞数 1

分类专栏： RPA教程 python基础 9.0版本体验文章标签： RPA 艺赛旗 iS-RPA

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44447687/article/details/94394497

版权

python基础同时被 3 个专栏收录

343 篇文章

订阅专栏

324 篇文章

订阅专栏

9.0版本体验

136 篇文章

订阅专栏

本文深入浅出地介绍了K近邻算法(KNN)的基本原理及应用。通过实例展示如何使用KNN进行分类，解释了相似性度量的重要性，并讨论了算法在实际场景中的有效性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

艺赛旗 RPA9.0全新首发免费下载点击下载
http://www.i-search.com.cn/index.html?from=line1

KNN 算法非常简单。很适合入门机器学习第一次学习的算法。

在这里插入图片描述

1、什么是 K 近邻算法？（图 1）

横轴：肿瘤病人肿块的大小。

纵轴：发现肿块的时间。

红色：良性肿瘤

蓝色：恶性肿瘤

1.1、假设新来了一个病人（绿色）。我们要判断这个病人，是属性恶性的还是良性的。那么 k 近邻边是要做的。（图 1.1）
在这里插入图片描述

现在取一个 k 值（k=3。这个 3 大家可以理解为是一个经验丰富的机器学习开发者，根据经验选取的一个最好值就是 3）。

1.2、那么 k 近邻要做的就是：对于新的点，在所有的点中寻找离新的点最近的三个点（图 1.2）。

在这里插入图片描述

这些最近的点，以他们自己的 lable（位置）和结果，进行投票。（上图离绿色点最近的三个点都是蓝色的恶性的点。所以蓝色对红色是 3:0。那么 k 近邻就会说这个绿色的点，很有可能是恶性的。这就叫做 k 近邻算法）。

1.3、K 近邻算法的本质：

两个样本，他们足够的相似的话，就有更高的概率属于同一个类别。（当然，只看离它最近的样本当然是不靠谱的。所以要看和他最相似 k 个样本，在 k 个样本当中，和哪种类别最相似，那么它就很有可能属于这个类别）。

描述两个样本是否相似的相似性。就是靠两个样本在这个特征空间中的距离进行描述的。

在这里插入图片描述
1.4 再举个例子：

如果再出现一个新的病人，那么离他最近的就是这三个点。（红色：蓝色 = 2:1，那么红色胜出。那么 k 近邻算法来说，这个新的点，很有可能就是良性的。）

在这里插入图片描述

K 近邻算法可以解决分类之类的问题。当然也可以解决线性回归。

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。