机器学习08:最近邻学习

作者:非妃是公主
专栏:《机器学习》
个性签:顺境不惰,逆境不馁,以心制境,万事可成。——曾国藩
在这里插入图片描述

专栏地址

《机器学习》专栏地址

专栏系列文章

机器学习01:绪论

机器学习02:模型评估

机器学习03:线性回归与多分类学习

机器学习04:支持向量机

机器学习05:神经网络学习

机器学习06:决策树学习

机器学习07:贝叶斯学习

机器学习08:最近邻学习

机器学习09:无监督学习

机器学习10:集成学习

机器学习11:代价敏感学习

机器学习12:演化学习

最近邻学习基础知识

根据分类的定义可知:分类包含两个阶段:训练阶段和工作阶段。

积极学习

到目前为止,我们前面介绍的所有机器学习技术都有显式的训练过程,都是在训练阶段就对训练样本进行学习处理,构建起分类模型,这类机器学习技术统称为“积极学习” (eager learning)。

消极学习

这一章我们将要介绍的最近邻学习,没有显式的训练过程,在训练阶段只是把训练样本保存起来,建模工作延迟到工作阶段才进行处理,这类机器学习技术统称为“消极学习”(lazy learning)

最近邻学习

最近邻学习不是在整个样本空间上一次性地估计目标函数,而是针对每个待测样本作出局部的目标函数逼近。当目标函数很复杂,但它可以用不太复杂的局部函数来逼近时,这样做有非常明显的优势。
最近邻学习可以为不同的待测样本构建起不同的目标函数逼近,因此相比于那些积极的学习技术,最近邻学习往往具有较高的分类性能。

最近邻学习基本思想

在这里插入图片描述
其实就是找到离待测样本最接近的k个样本,并统计他们的label,比如投票,哪个票数多就选哪个label作为样本的label。

最近邻学习常见问题

近邻索引为题

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在决策树的叶子结点上进行K-近邻索引

维度灾害问题

在这里插入图片描述
两种解决办法,属性加权和属性选择

邻域大小问题

在这里插入图片描述

后验概率问题

在这里插入图片描述

计算效率问题

在这里插入图片描述

归纳偏置问题

在这里插入图片描述
对不同属性增加权值来实现。

最近邻算法的改进——距离加权

在这里插入图片描述

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Cherries Man

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值