《机器学习》周志华(西瓜书)学习笔记第十章降维与度量学习

最新推荐文章于 2024-03-21 18:24:00 发布

Sundm@lhq

最新推荐文章于 2024-03-21 18:24:00 发布

阅读量2.9k

点赞数

分类专栏：机器学习西瓜书学习笔记文章标签：机器学习学习笔记降维度量学习

本文链接：https://blog.csdn.net/sdm12345/article/details/95335162

版权

本文是《机器学习》第十章的学习笔记，涵盖了降维与度量学习的关键概念。首先介绍了k近邻学习，包括其分类和回归策略。接着探讨了降维方法，如低维嵌入、主成分分析（PCA）、核化线性降维和流形学习，特别是等度量映射和局部线性嵌入。最后，文章讲解了度量学习的重要性，它是寻找合适距离度量以优化学习性能的过程。

摘要由CSDN通过智能技术生成

机器学习

总目录

第十章降维与度量学习

10.1 K近邻学习

k近邻学习是一种监督学习算法，在给定的训练样本集中，基于某种距离度量，找出与训练集最靠近的 $k$ 个训练样本，然后基于这k个邻居信息来进行预测。

投票法：通常在分类任务中使用，判别方法是选择这kk个样本中出现最多的类别标记作为预测结果。
平均法：通常在回归任务中使用，判别方法是将这kk个样本的实值输出标记的平均值最为预测结果。
加权平均或加权投票：根据距离远近来决定权重，距离越近，权重越大。

kNN虽然是一种监督学习方法，但是它却没有显式的训练过程，而是当有新样本需要预测时，才来计算出最近的k个邻居，因此kNN是一种典型的懒惰学习方法.

懒惰学习(lazy study)：没有显式训练过程，仅把样本保存，训练时间无开销，待收到测试样本后再进行处理
急切学习(eager learning)：在训练阶段就对样本进行学习处理的方法

k近邻分类器中，k为不同值时，分类结果也就不同；同时，若采用不同的距离计算方式，则找出的近邻也有显著差别，导致分类结果也显著不同。假设距离计算是恰当的，就是不考虑距离导致的差异性，而就从k这个参数的差异就最近邻分类器在二分类问题上的性能进行分析:
在这里插入图片描述

10.2 低维嵌入

高维情形下，样本数的采样以及距离计算问题。在高维情形下出现的数据样本稀疏、距离计算困难等问题，是所有机器学习方法共同面临的严重障碍，被称为维数灾难（curse of dimensionality）

缓解维数灾难的两个途径：

特征选择
降维（dimension reduction）

多维缩放(Multiple Dimensional Scaling, MDS)

目标:要求原始空间样本之间的距离在降维后的低维空间中得以保持

假定：m个样本在原始空间的距离矩阵为 $D\in R^{m*m}$ ，其第i行j列的元素 $dist_{ij}$ 为样本 $\bm{x_i}$ 到 $\bm{x_j}$ 的距离。我们的目标是获得样本在 $d ’$ 维空间的表示 $Z\in\mathbb{R}^{d’*m}，d≤d$ ，且任两个样本在d’维空间中的欧氏距离等于原始空间中的距离，即 $||\bm z_i-\bm z_j||=dist_{ij}∣∣$

降维后样本的内积矩阵
在这里插入图片描述
令将为后的降本Z被中心化

在这里插入图片描述

10.3 主成分分析

不同于MDS采用距离保持的方法，主成分分析（PCA）直接通过一个线性变换，将原始空间中的样本投影到新的低维空间中。简单来理解这一过程便是：PCA采用一组新的基来表示样本点，其中每一个基向量都是原来基向量的线性组合，通过使用尽可能少的新基向量来表出样本，从而达到降维的目的。

假设使用 $d ’$ 个新基向量来表示原来样本，实质上是将样本投影到一个由 $d ’$ 个基向量确定的一个超平面上（即舍弃了一些维度），要用一个超平面对空间中所有高维样本进行恰当的表达，最理想的情形是：若这些样本点都能在超平面上表出且这些表出在超平面上都能够很好地分散开来。但是一般使用较原空间低一些维度的超平面来做到这两点十分不容易，因此我们退一步海阔天空，要求这个超平面应具有如下两个性质：