浅谈knn(k近邻)算法

K近邻算法是一种懒惰学习方法,无需训练过程。其关键要素包括距离度量、K值选择和分类决策规则。通常采用欧式距离,K值选择依赖经验或使用验证方法,多数表决规则是最常见的分类决策方式。KNN适用于分类和回归,优点是准确度高、对异常值不敏感,但面临样本不均衡、效率低下和内存需求大的问题。
摘要由CSDN通过智能技术生成

概述

K近邻算法是一种懒惰算法,即没有对数据集进行训练的过程,其模型的三个要素:距离度量、k值的选择和分类决策规则决定。

K近邻的思想很简单,即在一个数据集上,给定一个新样本,找到与新样本距离最近的k个实例,在这些实例中属于多数的类即为这个新样本的类。

李航老师《统计学习方法》中,定义的K近邻算法如下:
这里写图片描述

距离度量:

算法虽然简单,但在其中也要解决一些问题滴。比如,距离度量该怎么选择、k值该怎么选择、分类决策规定该怎么选择。

对于距离度量,一般使用欧式距离,也可以使用其它距离的度量方式,常见的距离度量如下:

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值