9. K近邻算法 KNN

9. K近邻算法 KNN


  KNN算法也是经典的机器学习算法之一。本节对这个算法做一个简单的介绍。


1 简介

  • KNN是K-Neighbor Nearest的缩写,顾名思义,就是要寻找到距离最近的k个点。如果是分类问题,将该点分类为这k个点钟最多的那一类;如果是回归问题,预测值为这k个点的均值。

  • KNN算法是一个十分简洁容易解释的模型,并且只有k一个参数,这是它的优点。相反的,它也有很多的缺点,比如计算复杂度非常高,并且算法占用的内存很大。这个算法在训练的时候非常容易,就好比一个平常不好好学习的学生,到了考试就开始临时抱佛脚。KNN算法每预测一个测试数据就需要针对训练样本进行一次遍历,因此它的算法复杂度可以达到平方级别。

  • 在下图中,假设红色的三角形和蓝色的正方形已经被正确分类,现在我们需要预测绿色圆的分类。依照knn的规则,当我们取k=3时,显然被分类为红三角;当我们取k=5时,被分类为蓝正方形。可以看到,k的取值是对最终的预测结果有较大影响的。

    此处输入图片的描述


2 算法步骤

  1. 计算测试数据与各个训练数据之间的距离;
  2. 按照距离的递增关系进行排序;
  3. 选取距离最小的k个点;
  4. 确定前k个点所在类别的出现频率;
  5. 返回前k个点中出现频率最高的类别作为测试数据的预测分类。

3 算法总结

  • 在算法中衡量距离常用的是欧氏距离:

    d(x,y)=i=1n(xiyi
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值