k近邻基础概念与原理分析

K最近邻分类算法(k-Nearest Neighbor,KNN)

俗称:k近邻算法 也叫KNN算法

是最简单的机器学习算法之一,
K近邻算法的概念,即是给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例(也就是上面所说的K个邻居), 这K个实例的多数属于某个类,就把该输入实例分类到这个类中。
列入下图:
k近邻图片
上图中包含了已经确定的:蓝色方块与红色三角形
当新加入了绿色圆形样例需要进行分类,KNN算法将会从离这个样本最近的样本进行技术,依照个数投票决定应当属于哪一类中。

当k=3时,也就是图片当中的第一个实心圆圈,可以得到离样本最近的3个样本中有2个是红色三角形,1个蓝色正方形,所以被绿色圆圈将会被划分到红色三角形

但当k=5时,也就是图片当中的第一个实心圆圈,可以得到离样本最近的5个样本中有2个是红色三角形,3个蓝色正方形,此时这个绿色圆圈将会被划分到蓝色三角形

由此可得,KNN算法是将未知的样本类型依靠所处的位置与其最近的邻居的k个样本个数中,个数最多个数的种类决定它的类型。
所以一般k的取值都会选择奇数,便于得出结果。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值