机器学习-主成分分析PCA新的理解

最新推荐文章于 2024-06-18 18:45:59 发布

flowertree花树

最新推荐文章于 2024-06-18 18:45:59 发布

阅读量255

点赞数 3

分类专栏：机器学习文章标签：机器学习优化算法数学

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fuyan159357/article/details/51763166

版权

机器学习专栏收录该内容

21 篇文章 0 订阅

订阅专栏

这两天重新看了PCA的相关知识，重新理解了下数学推导，这篇文章把该讲的都讲了，附上链接。下面是一点理解，再迷惑的时候看看。

http://blog.codinglabs.org/articles/pca-tutorial.html

根据上述推导，我们发现要达到优化目前，等价于将协方差矩阵对角化：即除对角线外的其它元素化为0，并且在对角线上将元素按大小从上到下排列，这样我们就达到了优化目的。这样说可能还不是很明晰，我们进一步看下原矩阵与基变换后矩阵协方差矩阵的关系：

设原始数据矩阵X对应的协方差矩阵为C，而P是一组基按行组成的矩阵，设Y=PX，则Y为X对P做基变换后的数据。设Y的协方差矩阵为D，我们推导一下D与C的关系：

D = = = = = 1 m Y Y T 1 m (P X) (P X) T 1 m P X X T P T P (1 m X X T) P T P C P T

现在事情很明白了！我们要找的P不是别的，而是能让原始协方差矩阵对角化的P。换句话说，优化目标变成了寻找一个矩阵P，满足 PCPT 是一个对角矩阵，并且对角元素按从大到小依次排列，那么P的前K行就是要寻找的基，用P的前K行组成的矩阵乘以X就使得X从N维降到了K维并满足上述优化条件。

此时，我们把C的特征向量当做P，由于矩阵对角化的性质，D为对角化矩阵，对角线上的值为特征向量对应的特征值。特征向量有良好的性质两两正交，在基向量中两两正交，说明了降维之后保证每一维不相关。D的矩阵本身意义为降维之后的数据协方差矩阵，基向量两两正交说明不同属性协方差为0，但是保证同一属性降维后方差尽量大，也就是投影间距尽量大，所以取特征值的最大的几个做为降维的基向量，这样取P的前几行就可以。p*X得到Y降维后的数据。

flowertree花树

关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习-主成分分析PCA新的理解

这两天重新看了PCA的相关知识，重新理解了下数学推导，这篇文章把该讲的都讲了，附上链接。下面是一点理解，再迷惑的时候看看。http://blog.codinglabs.org/articles/pca-tutorial.html根据上述推导，我们发现要达到优化目前，等价于将协方差矩阵对角化：即除对角线外的其它元素化为0，并且在对角线上将元素按大小从上到下排列，这样我们就达到了优化目
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。