PCA算法的最小平方误差解释

最新推荐文章于 2020-12-05 02:57:35 发布

chs44444

最新推荐文章于 2020-12-05 02:57:35 发布

阅读量3.9k

点赞数 1

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chs44444/article/details/16371121

版权

机器学习专栏收录该内容

0 篇文章 0 订阅

订阅专栏

PCA算法另外一种理解角度是：最小化点到投影后点的距离平方和.
假设我们有m个样本点，且都位于n维空间 $x\in \mathbb{R}^n$ 中，而我们要把原n维空间中的样本点投影到k维子空间中去（k<n），并使得这m个点到投影点的距离的平方和最小.我们进一步假设投影矩阵P已经是标准化过的了（ $P=[u_1,u_2,\cdots,u_k]$ ，其中 $u_i$ 是n维的单位向量，且这组基向量两两正交）

投影矩阵具有如下性质：

$\begin{aligned} &P^n=P(n=1,2,\cdots),\quad P^T=P \\ &(I-P)^n=I-P(n=1,2,\cdots),\quad (I-P)^T=I-P \end{aligned}$

记每一个点 $x^{(i)}$ 对应的投影误差为 $e^{(i)}$ ，且投影误差的表达式为 $e^{(i)}=(I-P)x^{(i)}$ ，那么我们要最小化的表达式为：

$E'=\sum_{i=1}^{m}e^{(i)T}e^{(i)}$

为了后面的推导方便，我将上式除以 $\frac{1}{m}$ 即样本个数），由于其是定值，所以不影响我们问题的求解

$\begin{aligned} E&=\frac{1}{m}\sum_{i=1}^{m}e^{(i)T}e^{(i)}\\ &=\frac{1}{m}\sum_{i=1}^{m}[(I-P)x^{(i)}]^T (I-P)x^{(i)}\\ &=\frac{1}{m}\sum_{i=1}^{m}x^{(i)T}(I-P)^T (I-P)x^{(i)}\\ &=\frac{1}{m}\sum_{i=1}^{m}x^{(i)T}(I-P)^2 x^{(i)}\\ &=\frac{1}{m}\sum_{i=1}^{m}x^{(i)T}(I-P)x^{(i)}\\ &=\frac{1}{m}\sum_{i=1}^{m}x^{(i)T}x^{(i)}-\frac{1}{m}\sum_{i=1}^{m} x^{(i)T}Px^{(i)}\\ \end{aligned}$

由投影矩阵的性质 $P^2=P$ 有：

$E=\frac{1}{m}\sum_{i=1}^{m}x^{(i)T}x^{(i)} -\frac{1}{m}\sum_{i=1}^{m}x^{(i)T}P^2x^{(i)}$

由投影矩阵的对称性 $P^T=P$ 有：

$\begin{aligned} E=&\frac{1}{m}\sum_{i=1}^{m}x^{(i)T}x^{(i)}- \frac{1}{m}\sum_{i=1}^{m}x^{(i)T}PP^Tx^{(i)}\\ =&\frac{1}{m}\sum_{i=1}^{m}x^{(i)T}x^{(i)}- \frac{1}{m}\sum_{i=1}^{m}(P^Tx^{(i)})^T(P^Tx^{(i)})\\ =&\frac{1}{m}\sum_{i=1}^{m}x^{(i)T}x^{(i)} -\frac{1}{m}\sum_{i=1}^{m}(u_1^Tx^{(i)},u_2^T x^{(i)},\cdots,u_k^Tx^{(i)})(u_1^Tx^{(i)},u_2^T x^{(i)},\cdots,u_k^Tx^{(i)})^T \\ =&\frac{1}{m}\sum_{i=1}^{m}x^{(i)T}x^{(i)}- \sum_{j=1}^{k}\frac{1}{m}\sum_{i=1}^{m}u_j^T x^{(i)}x^{(i)T}u_j \\ =&\frac{1}{m}\sum_{i=1}^{m}x^{(i)T}x^{(i)}- \sum_{j=1}^{k}u_j^T\left( \frac{1}{m}\sum _{i=1}^{m}x^{(i)}x^{(i)T} \right)u_j\\ =&\frac{1}{m}\sum_{i=1}^{m}x^{(i)T}x^{(i)}- \sum_{j=1}^{k}u_j^T\Sigma u_j \end{aligned}$

因此， $\min E$ 等价于

$\begin{aligned} &\max_{u_1,u_2,\cdots,u_k}\sum_{j=1}^{k}u_j^T\Sigma u_j\\ &s.t.\quad u_j^Tu_j=1(j=1,2,\cdots,k) \end{aligned}$

求解上面的 $u_j$ 要用到最大方差解释中使用的Lagrangian Multiplier，在此不再赘述，而最后求得的 $u_1,u_2,\cdots,u_k$ 就是协方差矩阵 $\Sigma$ 的前k个特征向量

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
PCA算法的最小平方误差解释

a href="http://www.codecogs.com/eqnedit.php?latex=P(x|c)=\frac{P(c|x)\cdot P(x)}{P(x)}" target="_blank">img src="http://latex.codecogs.com/gif.latex?P(x|c)=\frac{P(c|x)\cdot P(x)}{P(x)}" title="P(x|c)
复制链接

扫一扫

专栏目录

chs44444 CSDN认证博客专家 CSDN认证企业博客

码龄13年

1: 原创

191万+: 周排名

128万+: 总排名

3999: 访问

: 等级

54: 积分

0: 粉丝

1: 获赞

1: 评论

3: 收藏

私信

关注

热门文章

PCA算法的最小平方误差解释 3999

分类专栏

机器学习

最新评论

PCA算法的最小平方误差解释
chengfanyong: 感觉你做错了，p与xi没法相乘应该写成ei = xi-pp’xi比较好吧

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。