PCA的劣势分析

最新推荐文章于 2024-06-18 01:01:10 发布

Y_hero

最新推荐文章于 2024-06-18 01:01:10 发布

阅读量1.1w

点赞数 9

分类专栏：机器学习文章标签： PCA劣势

本文链接：https://blog.csdn.net/Y_hero/article/details/88797908

版权

机器学习专栏收录该内容

9 篇文章

订阅专栏

PCA原理剖析
 矩阵的秩特征向量特征值是什么？
此篇博客主要分析PCA有什么劣势以及产生的原因，对PCA还不清楚的可以结合上面两个博客从多角度深入了解PCA。

劣势一，在对数据完全无知的情况下，PCA变换并不能得到较好的保留数据信息。

因为PCA需要对数据进行预处理，第一步需要对其进行中心化，如果数据的尺度不统一，还需要标准化。通常的标准化方式是除以标准差。这里可能就出出现一个问题，比如标准差很小，接近于零，尤其是被噪声污染的数据，噪声的标准差对数据的放大作用更显著，而没被噪声污染的数据其在标准化的过程中放大作用较小。

劣势二，对降维最终得到的数目，也就是潜在的隐变量的数目，不能很好的估计。

劣势三，PCA原理主要是为了消除变量之间的相关性，并且假设这种相关性是线性的，对于非线性的依赖关系则不能得到很好的结果。

使用PCA进行线性降维后样本间的非线性相关性有可能会丢失。

判断是否是线性降维过程可以用一个线性变换表示决定。pca降维的过程可以通过数据乘以一个矩阵表示，因此就是一个朴素的线性变换。

劣势四， PCA假设变量服从高斯分布，当变量不服从高斯分布（如均匀分布）时，会发生尺度缩放与旋转。

关注博主即可阅读全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Y_hero

关注关注

9
点赞
踩
24

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

浅谈PCA（3）

wbyang.cn

06-30

1959

主要谈谈PCA的假设条件和缺点。 PCA有以下几个假设条件: （1）线性（Linearity）：基变换的条件，即新得到的正交基可以由之间基的线性组合得到。目前有研究将这个条件转换到非线性条件下，例如Kernel PCA。（2）大方差对应重要数据结构（Large variances have important structur

主成分分析-PCA

最新发布

2301_77698138的博客

09-05

1432

PCA（主成分分析，Principal Component Analysis）是一种常用的数据降维技术。它的主要目的是通过线性变换将原始数据转换到新的坐标系统中，这个新坐标系统的各个坐标轴（即主成分）是原始数据的主要特征方向，这些方向上的数据方差最大，且各坐标轴之间相互正交。通过这种方式，PCA可以在保留数据重要特征的同时，减少数据的维度，简化数据，便于后续的数据处理和分析。

参与评论您还未登录，请先登录后发表或查看评论

层次分析matlab代码-SDCM:通过相关最大化进行信号解剖（SDCM）是克服PCA局限性的第一原理方法。它最大程度地提高了数据的一致性，从

05-23

PCA缺点

qq_16236875的博客

11-10

5112

ref：https://blog.csdn.net/Y_hero/article/details/88797908 1 在对数据完全无知的情况下，PCA变换并不能得到较好的保留数据信息因为PCA 需要对数据进行预处理，第一步需要对其进行中心化，如果数据的尺度不统一，还需要标准化。通常的标准化方式是除以标准差。这里可能就出现一个问题，比如标准差很小，接近于零，尤其是被噪声污染的数据，噪声的标准...

PCA算法缺点

01-29

1万+

主成分解释其含义往往具有一定的模糊性，不如原始样本完整贡献率小的主成分往往可能含有对样本差异的重以PCA一般不用来做直接的特征提取而是用来做特征矩阵的降维。当然，降维的结果用于分类并不理想，我们可以进一步Fisher变换（类内离差，类间阵增大类间距离，缩小类内距离）。但是Fisher变换会引入新的弱点，那就是对于训练类别的数据变得更敏感了，分类效果上升的代价是通用性下降，当

关于PCA算法的一点学习总结

热门推荐

习之北的专栏

05-04

4万+

本文出处：http://blog.csdn.net/xizhibei ============================= PCA，也就是PrincipalComponents Analysis，主成份分析，是个很优秀的算法，按照书上的说法：寻找最小均方意义下，最能代表原始数据的投影方法然后自己的说法就是：主要用于特征的降维另外，这个算法也有一个经典的应用：人脸识别。这里稍微

pca

suv1234的博客

05-25

699

参考http://www.cnblogs.com/pinard/p/6239403.html

机器学习——PCA 主成分分析

qq_60707366的博客

01-01

829

主成分分析是一种强大的数据降维技术，可以帮助提取数据的主要特征并消除相关性，有助于提高模型的准确性和可解释性。

主成分分析法PCA.docx

07-10

主成分分析（PCA）作为统计学中的一项重要技术，其核心在于通过正交变换将一组具有相关性的变量转换为一组线性无关的变量，从而实现数据降维，便于后续的数据处理和分析。在高维数据普遍存在的情况下，PCA已成为一种...

PCA主元分析方法描述

qq_38844711的博客

12-05

1569

主元分析也就是PCA，主要用于数据降维。转载知乎 https://www.zhihu.com/question/41120789/answer/481966094s 通过去中心化和线性变换，将多维度的特征转换通过投影（坐标转换）成几个主成分特征，这个主成分特征是原来特征的线性变换。主成分称为它们称作“主元1”、“主元2”。多维度特征直接有一定相关性！！线性变换是最小二乘法。两个坐标轴，减...

Python计算机视觉编程第六章——图像聚类(K-means聚类，DBSCAN聚类，层次聚类，谱聚类，PCA主成分分析)

Dujing2019的博客

06-25

7238

Python计算机视觉编程图像聚类（一）K-means 聚类1.1 SciPy 聚类包1.2 图像聚类1.1 在主成分上可视化图像1.1 像素聚类（二）层次聚类（三）谱聚类图像聚类（一）K-means 聚类 1.1 SciPy 聚类包 1.2 图像聚类 1.1 在主成分上可视化图像 1.1 像素聚类（二）层次聚类（三）谱聚类 ...

PCA主成分分析

Gordon的专栏

10-08

2473

13.2 PCA k “ V - ‘ 、 • 、' : ^ _ ^ f f h ' ? * r t 5 ； , ; ' . ^ i ' ' -:>?4f| 优点：降低数据的复杂性，识别最重要的多个特征。缺点：不一定需要, 且可能损失有用信息。适用数据类型：数值型数据。首先我们讨论? 0 人背后的一些理论知识，然后介绍如何通过?¥也 ( 》 1 的^ ^ ^ 7 来实现? 0

聊一聊PCA

xiaoge的机器学习专栏

01-18

1367

在最后一部分中，讲到了一些常用的方法，第一个讲到的就是降维（dimensionality-reduction）书中没有太过深入的将到为什么可以对特征经行降维，于是谷歌上乎找到了一篇应用达1000+的文章。具体链接：http://www.cs.otago.ac.nz/cosc453/student_tutorials/principal_components.pdf 该文较为详细的

PCA降维的一些思考

u010844092的专栏

03-02

1124

参考：http://blog.csdn.net/xiaojidan2011/article/details/11595869 我觉得参考网址里有句话说的很好，矩阵*矩阵的含义：右边矩阵的每个列向量在左边矩阵的行向量的投影变换。原矩阵设置为A(m*n)，B为寻找的降维矩阵，C为A降维后的矩阵 PCA降维实际就是寻找一个矩阵B，使得A在这个矩阵变换后的矩阵C（即C=B*A），投影字段内的方差最

PCA真实操作中的大坑

爱吃鱼的猫

11-13

3519

PCA真实操作中的大坑真的是伤不起啊。。。。今天讲一个潜意识出错的问题。在本人博客中有另外两篇转载的博客是记录PCA的思路讲解，有需要的可以看一下。

机器学习之PCA算法

笔记

06-25

2445

在机器学习中，我们通常面临的问题是，数据集包含大量特征，而这些特征之间可能存在冗余或相关性。这导致了两个问题：一是难以可视化和理解数据，二是可能会影响模型的性能和效率。PCA的目标就是通过线性变换将高维数据映射到低维空间，同时保持数据的主要信息。总结一下，PCA是一种常用的降维技术，通过线性变换将高维数据映射到低维空间，保留了主要信息，同时去除了冗余和相关性。PCA，即主成分分析（Principal Component Analysis），是一种常用的降维技术，用于从高维数据中提取最重要的特征。

机器学习——pca

m0_74100344的博客

06-18

1038

1 PCA的定义主成分分析（PCA，Principal Component Analysis）是一种常用的数据降维技术。它通过线性变换将原始数据映射到一个新的坐标系中，使得数据在新坐标系中的方差尽可能大，从而实现降维。PCA的主要目标是减少数据的维度，同时尽可能保留数据的主要特征和信息。线性变换：PCA通过线性变换将高维数据映射到低维空间。最大化方差：PCA选择的变换方向（主成分）是使得数据投影后的方差最大化的方向。正交主成分：各个主成分之间是正交的，即相互独立。

机器学习之主成分分析（PCA）

MakotoXavier的博客

06-16

1627

PCA是一种无监督学习方法，即在进行降维时不需要使用数据的标签信息。此外，PCA对数据的分布假设较强，如果数据中存在异常值或噪声，可能会对主成分的计算产生较大影响，导致降维效果不佳。因此，在实际应用中需要根据数据特性和需求选择合适的降维方法。由于降维后的数据保留了原始数据的主要特征信息，因此可以用于后续的机器学习模型训练、数据可视化等任务。

机器学习-9 降维算法——PCA降维

qq_51580006的博客

05-11

2949

①降维（Dimensionality Reduction，DR）是指采用线性或者非线性的映射方法将高维空间的样本映射到低维空间中。②降维获得低维空间的数据等价表示，实现高维数据的可视化呈现。仅仅需要以方差衡量信息量，不受数据集以外的因素影响。各主成分之间正交，可消除原始数据成分间的相互影响的因素。计算方法简单，主要运算是特征值分解，易于实现。