数据降维：PCA主成分分析降维示例及函数参数解释

最新推荐文章于 2023-10-08 21:49:23 发布

2020重新做人

最新推荐文章于 2023-10-08 21:49:23 发布

阅读量6.5k

点赞数 2

分类专栏：分析机器学习文章标签： PCA 数据降维机器学习主成分分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_36637463/article/details/97925584

版权

文章目录

主成分分析(PCA)介绍
PCA转化步骤
PCA示例
- sklearn中的PCA
PCA优缺点
- 优点
- 缺点

主成分分析(PCA)介绍

PCA也被叫做卡尔胡宁-勒夫转换(KLT)，是一种用户在高维空间发现模式的技术。PCA常被用于探索和可视化高纬度数据集。PCA可以压缩数据，也就是所谓的数据降维。数据降维是指在保留重要信息的同时消除那些“无用信息量的信息”。PCA关注的是线性相关性，如果一个数据矩阵的列空间的秩小于特征总数，那么多数特征就是几个关键的特征的线性组合,这些多数的特征是对空间以及计算能力的浪费，因为它们包含的信息可以从关键的特征推导出来，所以为了避免这种情况，PCA就是试图将这些数据挤压到一个维度大大小于原空间的线性子空间。
PCA的核心思想是：使用一些新的特征代替冗余特征，这些新特征能恰当地总结初始空间中包含的信息。

关于矩阵列空间以及秩可以看这篇文章
https://www.jianshu.com/p/15572fa072cf

在这里插入图片描述
如图a，数据点均匀的分布在两个特征上，在这个例子，列空间是满秩的。而有些特征是其他特征的线性组合，如图b，特征f1可以由f2得到，它是f2和一个标量的乘积。在这里我们称点团的本征维数为1，因为一个特征可以得到另一个特征。
但是实际上，完全相关的特征是很少见的，几乎不会出现，更多的情况是像图C一样

最低0.47元/天解锁文章

2020重新做人

关注

2
点赞
踩
30

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

2020重新做人 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。