PCA缺点

最新推荐文章于 2024-11-19 00:19:19 发布

368chen

最新推荐文章于 2024-11-19 00:19:19 发布

阅读量5.1k

点赞数 3

本文链接：https://blog.csdn.net/qq_16236875/article/details/102999145

版权

ref：https://blog.csdn.net/Y_hero/article/details/88797908

1 在对数据完全无知的情况下，PCA变换并不能得到较好的保留数据信息

因为PCA 需要对数据进行预处理，第一步需要对其进行中心化，如果数据的尺度不统一，还需要标准化。通常的标准化方式是除以标准差。这里可能就出现一个问题，比如标准差很小，接近于零，尤其是被噪声污染的数据，噪声的标准差对数据的放大作用更显著，而没被噪声污染的数据其在标准化的过程中放大作用较小。

2 对降维最终得到数目，也就是潜在的隐变量的数目，不能很好地估计。

3 PCA 原理主要是之间的相关性，并且假设这种相关性是线性的，对于非线性的依赖关系则不能得到很好的结果。

使用PCA 进行线性降维后样本间的非线性相关性有可能会丢失。

判断是否是线性降维后样本间的非线性相关性有可能会丢失

判断是否是线性降维过程可以用一个线性变换表示决定。pca 降维的过程可以通过数据乘以一个矩阵表示，因此就是一个朴素的线性变换。

4 pca 假设变量服从高斯分布，当变量不服从高斯分布（如均匀分布）时，会发生尺度缩放与旋转。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

368chen

关注关注

3
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

PCA：详细解释主成分分析

lanyuelvyun的博客

09-04

22万+

1 PCA目的/作用主成分分析算法（PCA）是最常用的线性降维方法，它的目标是通过某种线性投影，将高维的数据映射到低维的空间中，并期望在所投影的维度上数据的信息量最大（方差最大），以此使用较少的数据维度，同时保留住较多的原数据点的特性。 PCA降维的目的，就是为了在尽量保证“信息量不丢失”的情况下，对原始特征进行降维，也就是尽可能将原始特征往具有最大投影信息量的维度上进行投影。将原特征投影到...

浅谈PCA（3）

wbyang.cn

06-30

1957

主要谈谈PCA的假设条件和缺点。 PCA有以下几个假设条件: （1）线性（Linearity）：基变换的条件，即新得到的正交基可以由之间基的线性组合得到。目前有研究将这个条件转换到非线性条件下，例如Kernel PCA。（2）大方差对应重要数据结构（Large variances have important structur

参与评论您还未登录，请先登录后发表或查看评论

层次分析matlab代码-SDCM:通过相关最大化进行信号解剖（SDCM）是克服PCA局限性的第一原理方法。它最大程度地提高了数据的一致性，从

05-23

PCA的劣势分析

Y_hero的博客

03-25

1万+

PCA原理剖析矩阵的秩特征向量特征值是什么？此篇博客主要分析PCA有什么劣势以及产生的原因，对PCA还不清楚的可以结合上面两个博客从多角度深入了解PCA。劣势一，在对数据完全无知的情况下，PCA变换并不能得到较好的保留数据信息。因为PCA需要对数据进行预处理，第一步需要对其进行中心化，如果数据的尺度不统一，还需要标准化。通常的标准化方式是除以标准差。这里可能就出出现一个问题，比如标准差...

PCA算法缺点

01-29

1万+

主成分解释其含义往往具有一定的模糊性，不如原始样本完整贡献率小的主成分往往可能含有对样本差异的重以PCA一般不用来做直接的特征提取而是用来做特征矩阵的降维。当然，降维的结果用于分类并不理想，我们可以进一步Fisher变换（类内离差，类间阵增大类间距离，缩小类内距离）。但是Fisher变换会引入新的弱点，那就是对于训练类别的数据变得更敏感了，分类效果上升的代价是通用性下降，当

点云（网格）PCA及其存在的问题

qq_45607390的博客

11-19

840

当模型旋转角度过大时或者模型噪声较多或采样不规则时，PCA会存在配准结果不一的情况，具体可参加参考[3]论文中的分析。是自己定义的一个包，有。

关于PCA算法的一点学习总结

热门推荐

习之北的专栏

05-04

4万+

本文出处：http://blog.csdn.net/xizhibei ============================= PCA，也就是PrincipalComponents Analysis，主成份分析，是个很优秀的算法，按照书上的说法：寻找最小均方意义下，最能代表原始数据的投影方法然后自己的说法就是：主要用于特征的降维另外，这个算法也有一个经典的应用：人脸识别。这里稍微

【大数据】PCA算法

大雨淅淅的博客

09-02

1675

PCA（主成分分析）是一种统计方法，它使用正交变换将一组可能相关的变量转换为一组线性不相关的变量，这些新变量称为主成分。PCA的目标是通过减少数据的维度来简化数据集，同时尽可能保留原始数据的变异性。

PCA降维原理操作步骤与优缺点.pdf

05-12

然而，PCA也有其缺点： - 解释性问题：主成分并不直接对应原始特征，可能难以直观解释。 - 信息损失：虽然PCA试图保留最大方差，但它可能丢失某些重要但低方差的信息。 - 对异常值敏感：异常值可能导致主成分的估计...

PCANoiseLevelEstimator_ＰＣＡ去噪_matlab图像处理_

09-30

**PCA去噪的优缺点** 优点： 1. 自适应性强：PCA能自动捕捉数据的主要结构，无需人为指定去噪参数。 2. 可解释性强：降维后的主成分具有较强的物理意义，易于理解。 3. 计算效率高：对于大规模数据，PCA的计算...

PCA算法的原理及其示例

06-22

PCA算法的原理及其示例，包含基本原理和示例

PCA-Hotelling_机器学习_pca_PCA方法详解_

10-03

8. **优缺点**：PCA的优势在于简化数据复杂性，但可能会丢失部分非线性信息，并且对异常值敏感。 9. **其他相关方法**：对比PCA与其他降维方法，如LDA（线性判别分析）、t-SNE（t-distributed Stochastic Neighbor ...

PCA.rar_PCA ppt_pca

09-24

在"PCA.ppt"这个PPT文件中，可能详细讲解了PCA的理论基础、步骤、优缺点以及实际应用案例。其中，可能会涵盖以下内容： 1. PCA的数学原理和计算过程。 2. 如何选择合适的主成分数量。 3. PCA与相关方法（如因子分析...

PCA异常检测

猪逻辑公园

06-29

8118

Principle Component Analysis是主成分分析，简称PCA。它的应用场景是对数据集进行降维。降维后的数据能够最大程度地保留原始数据的特征（以数据协方差为衡量标准）。 PCA的原理是通过构造一个新的特征空间，把原数据映射到这个新的低维空间里。PCA可以提高数据的计算性能，并且缓解"高维灾难"。高维灾难详见https://www.leiphone.com/news/201706/...

基于RGB描述的PCA局部人脸重建的实验与局限性

chentingpc的专栏

04-21

4533

基于RGB描述的PCA局部人脸重建的实验与局限性原创学术笔记 FER PCA 创新项目机器视觉 *****2012-04-17 12:21:06 privacy:1 http://chentingpc.me/article/article.php?id=484 PCA的基本原理是寻找方差最大的投影方向来形成子空间，然后将原高维信息像子空间投影形成降维后的特征

pca

suv1234的博客

05-25

698

参考http://www.cnblogs.com/pinard/p/6239403.html

聊一聊PCA

xiaoge的机器学习专栏

01-18

1367

在最后一部分中，讲到了一些常用的方法，第一个讲到的就是降维（dimensionality-reduction）书中没有太过深入的将到为什么可以对特征经行降维，于是谷歌上乎找到了一篇应用达1000+的文章。具体链接：http://www.cs.otago.ac.nz/cosc453/student_tutorials/principal_components.pdf 该文较为详细的

PCA真实操作中的大坑

爱吃鱼的猫

11-13

3516

PCA真实操作中的大坑真的是伤不起啊。。。。今天讲一个潜意识出错的问题。在本人博客中有另外两篇转载的博客是记录PCA的思路讲解，有需要的可以看一下。

充电站位置规划策略：结合MIP模型与WVDM分析城乡充电网络布局，优化等待时间并降低建筑成本

最新发布

05-03

内容概要：本文探讨了充电站位置规划的数学建模方法及其应用，尤其关注城乡不同环境下的挑战与解决方案。对于农村地区，采用加权Voronoi图和最小生成树算法解决地形复杂性和需求分散的问题；对于城市，则利用排队论模型优化充电站的服务效率。此外，还讨论了如何通过灵敏度分析和机器学习方法提高模型的适应性和准确性。适用人群：从事电动汽车基础设施规划的研究人员和技术人员，以及对智能交通系统感兴趣的学者。使用场景及目标：适用于需要进行充电站选址规划的实际工程项目，旨在提高充电设施的覆盖率和服务质量，降低建设和运营成本。其他说明：文中提供了多个Python代码片段作为实例，帮助读者更好地理解和应用所介绍的技术手段。同时强调了理论模型与实际情况相结合的重要性，指出了一些常见的误区和改进方向。

PCA的优缺点

03-10

### 主成分分析（PCA）的优点 PCA作为一种重要的降维技术，在多个方面展现出显著的优势： - **数据降维**：能够有效地将高维度的数据集转换成低维度表示，从而简化模型并提高效率[^1]。 - **特征提取**：可以识别出最能代表原始数据变化趋势的关键属性，即所谓的“主成分”，这些新构建出来的变量彼此之间互不相关，有助于后续建模过程中的解释性和稳定性提升[^3]。 - **降低计算成本**：减少了参与运算的信息量，进而降低了算法执行所需的时间资源消耗；对于大规模数据集尤其重要。 - **去噪能力**：通过忽略那些贡献较小的次要因素，可以在一定程度上去除测量误差或其他形式干扰所带来的影响，使结果更加可靠稳定。 - **适用范围广**：不仅限于特定领域或应用场景，而是普遍适用于各类数值型结构化表格资料之上[^2]。 ### 主成分分析（PCA）的缺点尽管具有诸多优势，但在某些情况下也可能存在局限性： - **信息丢失风险**：当削减过多维度时可能会无意间舍弃掉一些潜在有价值的信息片段，特别是如果原空间里本身就不存在明显主导方向的话，则这种做法反而会损害表达力。 - **过拟合隐患**：仅依据现有样本分布情况来决定哪些轴更重要，这可能导致所选基底过分贴合当前观测值而无法很好地泛化到未知实例上，特别是在极端情形下甚至会出现过度适应训练集合的现象。 - **假设前提严格**：传统意义上的PCA假定输入矩阵服从多元正态分布，并且各分量间的协方差关系保持恒定不变。然而现实中许多现象并不满足上述条件，此时直接套用该方法未必能得到理想效果[^4]。 ```python import numpy as np from sklearn.decomposition import PCA # 创建一个随机数据集用于演示 X = np.random.rand(100, 5) # 初始化PCA对象并将数据投影至两个主成分构成的新坐标系中 pca = PCA(n_components=2) principalComponents = pca.fit_transform(X) print(principalComponents.shape) # 输出变换后的形状 ```