K近邻算法原理

19 篇文章 43 订阅 ¥19.90 ¥99.00
本文介绍了K近邻(KNN)算法的基本思想、欧氏距离、算法流程及其在分类和回归问题中的应用。KNN通过计算未知样本与训练样本的距离,依据最近邻居的类别或属性值进行预测。K值的选择会影响预测结果,过小易受噪声影响,过大则引入远处样本的干扰。距离度量是影响KNN的另一个关键因素,通常使用欧式距离,但也包括其他相似性度量。
摘要由CSDN通过智能技术生成

咱们来一起学习一下K近邻(k-nearest neighbors,简称KNN)算法的基本原理~

基本思想

首先来看这样一幅图:
K近邻
我们根据涂色样本点和未涂色样本点 X 的距离给涂色样本点编号1-6,即:1号样本点距离X最近,其余次之。

那么问题来了:样本点 X 应该属于哪种颜色呢?是蓝色还是绿色?

其实,我们可以根据 X 的相邻样本点来判定。例如,和 X 距离最近的三个样本点中绿色占多数,那么 X 就属于为绿色;和 X 距离最近的 5 个样本点中蓝色占多数,那么 X 就属于蓝色。

这种解决问题的思路正是 K 近邻算法的基本思想:根据 K 个近邻样本的 y 值来预测自身的 y 值。具体到上面例子中的 y 值就是样本点的颜色。

K 近邻是监督学习中比较简单的一种算法,它既可以解决分类问题,也可以解决回归问题。

上面的涂色问题本质上就是利用 K 近邻算法给颜色未知的样本进行分类。颜色已知的样本属于训练样本,颜色未知的样本属于测试样本。

我们已经知

评论 447
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

꧁༺北海以北的等待༻꧂

欢迎为萌新程序员打赏~谢谢各位

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值