机器学习 | 线性方法降维（理论篇）_两个不同的节点特征通过线性降维之后会不会是一样的特征-CSDN博客

本文链接：https://blog.csdn.net/apengpengpeng/article/details/80866045

本文探讨了机器学习中的降维技术，包括特征选择和特征提取。重点讲解了特征提取，特别是主成分分析(PCA)和线性判别分析(LDA)。PCA通过最大化样本投影后的方差进行降维，而LDA则结合类别信息，最小化相同样本的方差并最大化不同样本的间隔。降维有助于在低维空间中保留关键信息，降低计算复杂性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

科幻名著《三体》里有句犀利的台词——降低维度用于攻击。不过，这个“降维”绝对不只是科幻界的专用名词。

在机器学习中，降维同样重要。很多人把降维（Dismensionality reduction），特征选择（feature selection），以及特征提取（feature extraction）混为一谈，因为这三者都削减了进入模型的变量个数。

降维是一个更为宽泛的概念，它包括特征选择和特征提取。

特征选择
降维过后，最终使用的变量个数减少了，但特征选择挑选的是特征子集，也就是说，保留下来的所有特征都在原来的特征集中可以找到。
特征提取
而特征提取所提取的是不再是特征子集，而是原来特征的线性（或者非线性）组合，我们经过特征提取后的变量都是新的变量，它的本质是将原始高维空间向低维空间投影，我们所使用的特征不仅少了，而且不再是原来的特征。

我们引入一个更为重要的概念——距离。
- 距离
每个样本可以表示为一个向量，也就是高维空间的一个点，距离可以用来衡量样本之间的相似度。但是在高维空间，距离的计算会变得非常困难，而我们关心的问题可能在低维空间就会得到很好的解决。但这不意味着低维空间只是对高维空间的近似，有些问题中，高维空间会增加很多噪声，而在低维空间中会得到比高维空间更好的性能。

因此，我们讨论一下降维的几种方法，特征选择的方法会在后续文章中更新，在本文中降维特指“特征提取”。降维有两种分类方法：其一，根据目标值（target）的参与与否，分为有监督降维和无监督降维；其二，根据高维空间与低维空间的关系，分为线性降维和非线性降维。

我们对每种方法分举一例：