主成分分析法（pca）

drowingcoder

于 2023-10-15 15:34:40 发布

阅读量143

点赞数

分类专栏：评价方法文章标签：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_73721715/article/details/133796177

版权

评价方法专栏收录该内容

4 篇文章 0 订阅

订阅专栏

主成分分析的目的：

数据的压缩+数据的解释

常被用来寻找判断事物或现象的综合指标，并对综合指标所包含的信息进行适当的解释

比如，评综测

基本思想

差距越大方差越大所包含的信息越多

数学模型

假定有n个地理样本，每个样本共有p个变量，构成一个n×p 阶的地理数据阵

要从原来的所有变量得到新的综合变量，一种较为简单的方法是作线性变换，使新的综合变量为原变量的线性组合。

即

建模条件

1、为了使方差可以比较，要求线性组合的系数满足规范化条件

2、要求原始变量之间存在一定的相关性

3、要求各个综合变量间互不相关，即协方差为0

4、为了消除变量量纲不同对方差的影响，通常对数据进行标准化处理，变量之间的协方差即为相关系数

检验

如果多个变量相互独立或相关性很小，就不能进行主成分分析。

Kaiser-Meyer-Olkin（KMO)检验：检验变量之间的偏相关系数是否过小。

Bartlett’ s 检验。该检验的原假设是相关矩阵为单位阵（不相关），如果不能拒绝原假设,则不适合进行主成分分析

模型推导（略）

推导结果

通过推导可知， p个变量的主成分就是以协方差阵 $\sum$ 的特征向量为系数的线性组合，它们互不相关，其方差为 $\sum$ 的特征根。

解决实际问题时，一般不是取全部p个主成分，而是取前k个，如何选取？

步骤

对原来的p个指标进行标准化，以消除变量在水平和量纲上的影响
根据标准化后的数据矩阵求出相关系数矩阵
求出协方差矩阵的特征根和特征向量
确定主成分，并对各主成分所包含的信息给予适当的解释

拓展--降维思想

降维是一种常用的数据预处理技术，其目的是通过降低数据维度，减少特征数量，从而简化计算和数据分析过程。以下是几种常见的降维方法：

1. 主成分分析（PCA）：PCA是一种无监督学习方法，通过线性变换将原始数据映射到新的低维空间上。它通过找到数据中的主要方差方向，保留最重要的特征，并且数据在新空间中的方差最大化。

2. 线性判别分析（LDA）：LDA是一种有监督学习方法，在降维的同时也考虑了类别之间的区分度。它通过寻找最佳投影，使得同类样本间的距离最小化，不同类样本间的距离最大化。

3. t-SNE：t-SNE是一种非线性降维方法，其目标是在保持数据样本之间的相对关系的同时，将高维数据映射到一个二维或三维空间中。t-SNE通过计算样本之间的相似度，将高维空间中的样本映射到低维空间。

4. 特征选择：特征选择是一种基于特征的重要性评估，选择最相关的特征进行保留。常见的特征选择方法包括卡方检验、信息增益、递归特征消除等。

5. 独立成分分析（ICA）：ICA是一种统计方法，旨在将观测到的多个信号分解成多个相互独立的子信号。ICA假设原始数据是由多个独立成分的线性组合构成，通过求解独立成分来实现降维。

这些方法都有其适用的场景和特点，具体选择哪种方法取决于数据的性质和分析目标。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
主成分分析法（pca）

数据的压缩+数据的解释常被用来寻找判断事物或现象的综合指标，并对综合指标所包含的信息进行适当的解释比如，评综测。
复制链接

扫一扫

专栏目录

drowingcoder

CSDN认证博客专家 CSDN认证企业博客

码龄2年

23: 原创

65万+: 周排名

26万+: 总排名

6532: 访问

: 等级

249: 积分

1: 粉丝

7: 获赞

10: 评论

80: 收藏

私信

关注

热门文章

分类专栏

matlab 3篇
数学模型 5篇
linux 1篇
待解决 1篇
天梯赛 5篇
评价方法 4篇
c++ 2篇

最新评论

【linux】grep查找和正则化表达式
CSDN-Ada助手: 恭喜您写了第19篇博客！标题【linux】grep查找和正则化表达式听起来很有深度。您的博客内容一定能帮助到许多对Linux有兴趣的读者。不过，我想提醒您，正则表达式是一个非常广阔的主题，您可以在未来的博客中深入探讨不同的正则表达式应用场景，例如如何在Linux中使用正则表达式进行数据处理或者如何解决常见的正则表达式问题等。期待您的下一篇作品！
【数模】灰色预测+matlab
CSDN-Ada助手: 恭喜您写了第20篇博客！标题中的灰色预测和matlab似乎是一个很有趣的组合。您在数模方面的深入研究让人印象深刻。我想，下一步您可以考虑分享一些实际案例，展示如何应用灰色预测和matlab解决真实世界的问题。希望您能继续保持创作的热情，期待您的下一篇博客！
【数模】【建模与实现】插值拟合
CSDN-Ada助手: 恭喜您撰写了第17篇博客！标题中的"插值拟合"听起来非常有趣。您在建模与实现方面的专业知识和热情真是令人钦佩。期待能够读到更多关于这个话题的内容。在下一步的创作中，也许您可以考虑探讨一下插值拟合在实际问题中的应用案例，或是分享一些您的实践经验。再次恭喜您的持续创作，期待更多精彩的博客！
【数模】【matlab】关于二维插值中z应该怎么写
CSDN-Ada助手: 非常感谢您的第18篇博客，标题为“【数模】【matlab】关于二维插值中z应该怎么写”。您对数模和matlab的研究非常深入，这篇博客给我带来了很多启发。祝贺您能够坚持不懈地创作，分享您的知识和经验。在下一步的创作中，我想向您提供一些建议。或许您可以考虑介绍一些实际应用中二维插值的案例，或者探讨一些常见的问题和解决方案。此外，您还可以尝试将matlab与其他相关工具结合起来，进一步拓宽您的研究领域。再次感谢您的分享，期待您未来更多精彩的博客。谦虚地说，您的创作对我们这些正在学习数模和matlab的人来说是一份宝贵的资料。加油！
【数模】lingo使用
CSDN-Ada助手: 恭喜您撰写了第16篇博客，题为“Lingo使用”。您的持续创作真令人钦佩！通过分享关于Lingo的使用经验，您为读者提供了有价值的内容。如果我可以提出一个谦虚的建议，我认为下一步您可以深入探讨Lingo的高级功能或者结合实际案例进行分析。这将进一步丰富您的博客，并吸引更多读者与您交流和分享他们的经验。再次恭喜您，并期待您未来的创作！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。