kNN算法解析及应用【内附详细代码和数据集】

首先,我们需要了解什么是“kNN”

kNN英文全称k Nearest Neighbor,即k近邻算法

  • 用途:分类问题
  • kNN的工作原理:事先有一个有标签的样本数据集,然后输入没有标签的新数据后,将新数据的每个特征和样本集里的数据对应特征进行比较,最后算法提取样本集中特征最相似(最近邻)数据的分类标签。一般而言,只取k个最相似数据中出现次数最多的分类作为新数据的分类。
  • 优点:精度高、对异常值不敏感、无数据输入假定。
  • 缺点:计算复杂度高、空间复杂度高。
  • 适用的数据范围:数值型和标称型。

一通文字理解下来后,下面给一个小例子

首先需要了解欧氏距离,很简单,就是平面上的两点之间的距离。

例:点A(x1, y1)与点B(x2, y2)之间的距离为 D=\sqrt{(x1 - x2)^{2} + (y1 - y2)^{2}}

样本数据集

样本编号 X Y label
1 1.0 1.1 A
2 1.0 1.0 A
3 0 0 B
4 0 0.1 B

测试数据

编号 X Y label
1 0.1 0.1 待分类

从直观层面上就可以看出测试数据距离B类比

  • 5
    点赞
  • 45
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值