用Python的sklearn库进行PCA（主成分分析）

最新推荐文章于 2025-04-29 22:56:57 发布

puredreammer

最新推荐文章于 2025-04-29 22:56:57 发布

阅读量10w+

点赞数 48

分类专栏：数据挖掘&人工智能文章标签：机器学习 PCA

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/puredreammer/article/details/52255025

版权

在python的sklearn的库里面集成很多机器学习算法的库，其中也包括主成分分析的方法。

1.PCA算法的原理：

PCA主要是用来数据降维，将高纬度的特征映射到低维度的特征，加快机器学习的速度。比如在三维空间里面有一个薄饼状的三维物体，由于薄饼的厚度相对于薄饼的直径要小很多很多，故我们在平时的时候就说这个薄饼是圆的，而不说它的是圆柱的，这就是无意识中把描述薄饼的特征从三维降到二维了。（由于学识疏浅，这个例子可能不是特别恰当，还请谅解）。

下面看这个图片（该图片来自台湾大学李宏毅老师的ppt）：

在这个图片中，我们用两个特征，一个是attack，一个是defense来描述样本。但是如下图所示，我们作了两条线，可以看出在右边这条线上有较大的方差，而左边这条线的方差比较小，我们知道，方差越大，所包含的信息就越多。那么如何把这两个特征进行降维呢，降维要尽可能保持原始数据的信息，故要取使方差最大的一个维度（本例中从二维降到一维）。假设右边这条线的方差最大，我们就可以把这条线所在的直线当作降维后的一个维度。也就是二维降到一维后，这个一维空间的x轴所在的位置。那么这个降维后的x轴代表着什么呢？在本例中

最低0.47元/天解锁文章

评论 19

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。