从矩阵几何的角度简单推导PCA主成分分析

好学的学渣

已于 2023-11-28 14:09:33 修改

阅读量466

点赞数 15

分类专栏：矩阵论学习笔记18.06升级版矩阵论学习笔记18.06 文章标签：矩阵线性代数

于 2023-11-10 15:23:10 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39494059/article/details/134333235

版权

矩阵论学习笔记18.06 同时被 2 个专栏收录

23 篇文章 0 订阅

订阅专栏

矩阵论学习笔记18.06升级版

16 篇文章 0 订阅

订阅专栏

PCA的几何意义是找出一个新坐标系,在这个新坐标系下第一个维度是变化是最大的,最后一个维度变化是最小的.

在常用的降维用法中,最后几个维度可以删掉,因为他们没什么变化,在理想的情况下他们都是一个常数,对决策完全不提供有用的信息

衡量变换方法是方差,所以主成分分析在协方差矩阵中的体现就是让协方差矩阵对角元素即方差最大化.

从矩阵乘法理解方式的2.1可以知道,换坐标系其实就是乘以一个正交矩阵

所以上面问题用矩阵的语言可以这么描述,给一个正交矩阵Q,它把数据A(数据按列堆叠成的矩阵)转换到新坐标系Q下,新数据是QA,它的协方差矩阵中方差项最大化

假定数据已经中心化过,A的协方差矩阵C是 $AA^T/(n-1)$ ,(ps:n-1是无偏估计,换成n也差不多)
QA的协方差矩阵 $C^Q$ 就是 $QA)(QA)^T/(n-1)=QAA^TQ^T/n-1$

我们牢记方差项最大化,首先先找第一个维度,让 $C^Q_{11}$ 最大.
那么协方差矩阵第一行和第一列必然是长这样的 $(x, 0, 0, ...)$
因为换坐标系也可以理解成旋转,它不会改变长度.
$(x, 0, 0, ...)$ 的模长是 $x^2$ ,第一列如果存在其他非0元素,那么第一个元素必然要比 $x$ 小,但凡不小模长都会比 $x^2$ 大,而不是相等

所以我们有结论了,要使得第一个维度的方差 $C^Q_{11}$ 最大.第一行和第一列必然是长这样的 $(x, 0, 0, ...)$

接下来确定第一维度后,就可以确定剩下的了.因为第一行和第一列已知,现在可以把协方差矩阵第一行和第一列去掉,开始让新的 $C^Q_{11}$ 最大.毫无疑问,他还是长 $(x, 0, 0, ...)$ 这样

经过反复确定,我们现在知道了,新的协方差矩阵必然是对角矩阵,这样才能让方差项最大化

那么问题就变成让 $QAA^TQ^T/n-1$ 变成对角矩阵,我们可以简单的把分母丢了,因为常数不影响它是不是对角矩阵

$AA^T$ 是对称矩阵,他可以对角矩阵可以分解成 $Q\Lambda Q^T$ 的形式,为了区分两个正交矩阵,这里的正交矩阵就用 $Z$ 表示,即 $AA^T=Z\Lambda Z^T$
所以 $QAA^TQ^T=QZ\Lambda Z^TQ^T$ ,很显然当 $Q=Z^T$ 时,两边都可以消掉.当然别忘了老知识(正交矩阵的逆矩阵就是转置)

所以 $Z^T$ 就是那个能满足要求的新坐标系,它是协方差矩阵分解出来的,是协方差矩阵特征向量的堆叠

好学的学渣

关注

15
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
从矩阵几何的角度简单推导PCA主成分分析

所以上面问题用矩阵的语言可以这么描述,给一个正交矩阵Q,它把数据A(数据按列堆叠成的矩阵)转换到新坐标系Q下,新数据是QA,它的协方差矩阵中。在常用的降维用法中,最后几个维度可以删掉,因为他们没什么变化,在理想的情况下他们都是一个常数,对决策完全不提供有用的信息。接下来确定第一维度后,就可以确定剩下的了.因为第一行和第一列已知,现在可以把协方差矩阵第一行和第一列去掉,开始让新的。PCA的几何意义是找出一个新坐标系,在这个新坐标系下第一个维度是变化是最大的,最后一个维度变化是最小的.小,但凡不小模长都会比。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。