【机器学习】PCA推导

最新推荐文章于 2022-12-23 18:25:14 发布

郑壮强

最新推荐文章于 2022-12-23 18:25:14 发布

阅读量474

点赞数

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/qq_18500245/article/details/95852565

版权

机器学习专栏收录该内容

7 篇文章 0 订阅

订阅专栏

【机器学习】PCA推导

PCA（主成分分析）是一种线性降维方式，它基于最大重构性对数据进行降维。

记数据集为 $X_{m\times n}$ ，其中 $m$ 为样本数量， $n$ 为原始特征空间的特征维数。设线性变换矩阵为 $W_{n\times d}$ ，其中列向量之间彼此正交，且模长为1。则降维后的样本 $Z = X W$ , 重构损失可以表示为 $loss = || X-XWW^T||_{F}^{2}$ .
$\begin{aligned} &\mathop{\arg\min}\limits_{\theta} || X-XWW^T||_{F}^{2}\\ =&\mathop{\arg\min}\limits_{\theta} tr[(X-XWW^T)(X-XWW^T)^T]\\ =&\mathop{\arg\min}\limits_{\theta} tr[(X-XWW^T)(X^T-WW^TX^T)]\\ =&\mathop{\arg\min}\limits_{\theta} tr(XX^T-2XWW^TX^T-XWW^TWW^TX^T)\\ =&\mathop{\arg\min}\limits_{\theta} tr(XX^T-2XWW^TX^T+XWW^TX^T)(因为W^TW=E_{d\times d}))\\ =&\mathop{\arg\min}\limits_{\theta} tr(XX^T-XWW^TX^T)\\ =&\mathop{\arg\min}\limits_{\theta} tr(-XWW^TX^T)\\ =&\mathop{\arg\max}\limits_{\theta} tr(XWW^TX^T)\\ =&\mathop{\arg\max}\limits_{\theta} tr[W^T(X^TX)W]\\ \end{aligned}$
令 $X^TX=Q\Lambda Q^T, W=QY$ ，则有
$\begin{aligned} &\mathop{\arg\max}\limits_{\theta} tr[W^T(X^TX)W]\\ = &\mathop{\arg\max}\limits_{\theta} tr[Y^TQ^TQ\Lambda Q^TQY]\\ = &\mathop{\arg\max}\limits_{\theta} tr[Y^T\Lambda Y]\\ \end{aligned}$
从而PCA降维至 $d$ 维后其最优值维 $d$ 个最大的特征值的和， $Y$ 维单位矩阵，线性变换矩阵对应的特征向量.(这个从而有点尴尬，但是我不会啦，网上也没找到相关的证明，都是从而）

PCA去中心化与不去中心化的区别：
从最大重构性的角度，是否去中心化无关紧要。
从最大可分性的角度，即最大化数据集的方差，需要中心化。中心化后最大重构性与最大可分性是等价的。中心化是有用的，在继续往下推的时候会用到

郑壮强

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【机器学习】PCA推导

【机器学习】PCA推导PCA（主成分分析）是一种线性降维方式，它基于最大重构性对数据进行降维。记数据集为Xm×nX_{m\times n}Xm×n，其中mmm为样本数量，nnn为原始特征空间的特征维数。设线性变换矩阵为Wn×dW_{n\times d}Wn×d，其中列向量之间彼此正交，且模长为1。则降维后的样本Z=XWZ=XWZ=XW, 重构损失可以表示为 loss=∣∣X−XWWT∣∣F...
复制链接

扫一扫

专栏目录