机器学习 第十章 降维与度量学习

本文深入探讨了机器学习中的降维技术,包括k近邻学习、多维缩放(如MDS算法)、主成分分析(PCA)、核化线性降维和流形学习(如Isomap和LLE)。同时,介绍了度量学习的概念,即学习数据的合适距离度量以优化学习性能。
摘要由CSDN通过智能技术生成

第十章 降维与度量学习

  • k近邻学习
  • 多维缩放
  • 主成分分析
  • 流形学习
  • 度量学习

10.1 k近邻学习

  • k近邻(k-Nearest Neighbor, kNN)学习是一种常用的监督学习方法
  • 懒惰学习:此类学习技术在训练阶段仅仅是把样本保存起来,训练时间开销为零,待收到测试样本后再进行处理。
  • 急切学习: 在训练阶段就对样本进行学习处理的方法。
  • 最近邻分类虽简单,但它的泛化错误率不超过贝叶斯最优分类器错误率的两倍!

10.2 低维嵌入

  • 上述讨论基于一个重要的假设:任意测试样本附近的任意小的 距离范围内总能找到一个训练样本,即训练样本的采样密度足够大,或称为“密采样”。
  • 在高维情形下出现的数据样本稀疏、距离计算困难等问题,是所有机器学习方法共同面临的严重障碍,被称为“维数灾难”。
  • 降维:即通过某种数学变换,将原始高维属性空间转变为一个低维“子空间” (subspace),在这个子空间中样本密度大幅度提高,距离计算也变得更为容易。
  • 降维的好处:
    • 算法性能
    • 去噪

1. 多维缩放(MDS算法)

  • 多维缩放:原始空间中样本之间的距离在低维空间中得以保持

  • 对矩阵B做特征值分解后,将为0的特征值对应的特征向量去掉,取值很小的特征值也可以去掉,

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值