KNN算法

K近邻算法

原理:任何样本点的特征和该点的邻近点特征类似,so我们可以认为使用某个点的多个邻近点的特征就可以表示该点的特征。
KNN分类算法:就是邻近点中类别最多的那个类别作为当前点的类别。
KNN回归算法:使用所有邻近点的均值作为当前点的回归预测值。

KNN分类算法举例说明。如图:

在这里插入图片描述
例如:黄色圆圈要被赋予那个类,是绿色三角形还是紫色矩形。
如果:K=3,由于绿色三角形占比为2/3,紫色矩形占比为1/3,则黄色圆圈将被赋予绿色三角形。
如果:K=5,由于绿色三角形占比为2/5,紫色矩形占比为3/5,则黄色圆圈将被赋予紫色矩形。

KNN算法中,K是一个超参,需要交叉验证来确定(一般K取值为奇数),K值过小可能会导致过拟合(可能噪声点的数据会产生不好的影响),K值过大会增加计算量。

KNN的核心就是找出邻近点,需要使用某个公式或者某种方式来判断样本点的距离,一般使用欧几里得距离。
欧几里得距离 计算A和B样本点的欧几里得距离方法如下:
在这里插入图片描述
在这里插入图片描述

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值