KNN算法思想与应用例子

    这篇文章是在学习KNN时写的笔记,所参考的书为《机器学习实战》,希望深入浅出地解释K近邻算法的思想,最后放一个用k近邻算法识别图像数字的例子。    

    KNN算法也称K近邻,是一种监督学习算法,即它需要训练集参与模型的构建。它适用于带标签集的行列式(可理解为二维数组)的数据集。

    需要准备的数据有:训练数据集,训练标签集(每个数据与每个标签都一一对应)用于参与模型构建;
    需要测试的数据集——通过这个模型得出——标签集(每个数据对应的标签)

举个例子:我们把人体的指标量化,比如体重多少,三围多少,脂肪比例多少,然后这个标签就是性别(男或女)。我们的训练数据集就是500个男性和500个女性的身体指标,每个数据对应性别标签(男或女),这个就是训练标签集。然后我们输入一个人的指标,模型给出一个性别的判断,这个就是输出的标签集,也就是最后的预测结果。

算法的流程为:

      1、计算输入测试数据与训练数据集的距离,这里用欧式距离来计算。

      2、根据得到的距离大小,按升序排序

      3、取前K个距离最小的数据集对应的标签

      4、计算这些标签的出现频率

      5、取出现频率最高的标签作为输入的测试数据的最后的标签,即预测结果

其中,欧式距离的计算公式如下:<

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值