浅谈线性PCA的实现过程

最新推荐文章于 2022-09-25 16:46:31 发布

lisenpy

最新推荐文章于 2022-09-25 16:46:31 发布

阅读量392

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lisenby/article/details/117386106

版权

PCA 主成分分析法，是当今最流行的降维算法之一。其中又分为核PCA，线性PCA，对应于不同形态的数据降维他识别最靠近数据集的超平面，然后将数据投影到这个超平面上。从上面的图中，可以发现将数据投影到C1这个轴上能保留最大的差异性，其他两条虚线保留的差异性比C1实线少，而选择一条能保留最大差异性的轴就是PCA降维技术比较简单的思想。PCA算法可以找到对差异贡献最大的轴，以及一条和这个轴正交的轴，在上图中C2，C2是对剩余的差异性贡献最大的轴，因为上图是一个二维数据，在更高维的数据中找到与前两条线正交的

摘要由CSDN通过智能技术生成

PCA 主成分分析法，是当今最流行的降维算法之一。其中又分为核PCA，线性PCA，对应于不同形态的数据降维
他识别最靠近数据集的超平面，然后将数据投影到这个超平面上。

在这里插入图片描述
从上面的图中，可以发现将数据投影到C1这个轴上能保留最大的差异性，其他两条虚线保留的差异性比C1实线少，而选择一条能保留最大差异性的轴就是PCA降维技术比较简单的思想。

PCA算法可以找到对差异贡献最大的轴，以及一条和这个轴正交的轴，在上图中C2，C2是对剩余的差异性贡献最大的轴，因为上图是一个二维数据，在更高维的数据中找到与前两条线正交的第三第四条等，数量可以和数据集的维度相同。
而找到的第i个轴就是第i个主要成分。
可以通过SVD（奇异值分解）的标准矩阵分解方法寻找主要成分，这个技术可以将矩阵χ分解成三个矩阵在这里插入图片描述其中V包含定义所有主成分的单位向量。

假使自己编程实现记得要居中数据，居中的过程就是 X-X.mean()。我一般直接使用sklearn的pca模块实现，它会自动居中数据。

一旦我们确定投影的维度，就可以将训练数据集投影到维度d的超平面，同时得到维度d的简化数据集Xd。
计算训练数据集矩阵X和矩阵Wd的点积，Wd是包含V的前d列的矩阵（V是奇异值分解而来）。

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
浅谈线性PCA的实现过程

PCA 主成分分析法，是当今最流行的降维算法之一。其中又分为核PCA，线性PCA，对应于不同形态的数据降维他识别最靠近数据集的超平面，然后将数据投影到这个超平面上。从上面的图中，可以发现将数据投影到C1这个轴上能保留最大的差异性，其他两条虚线保留的差异性比C1实线少，而选择一条能保留最大差异性的轴就是PCA降维技术比较简单的思想。PCA算法可以找到对差异贡献最大的轴，以及一条和这个轴正交的轴，在上图中C2，C2是对剩余的差异性贡献最大的轴，因为上图是一个二维数据，在更高维的数据中找到与前两条线正交的
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。