PCA推导

最新推荐文章于 2024-04-14 05:42:29 发布

0ng

最新推荐文章于 2024-04-14 05:42:29 发布

阅读量157

点赞数

分类专栏：机器学习公式推导

本文链接：https://blog.csdn.net/weixin_43804251/article/details/107161439

版权

机器学习同时被 2 个专栏收录

13 篇文章 3 订阅

订阅专栏

公式推导

11 篇文章 1 订阅

订阅专栏

个人笔记，非教程

$d\times n$
$D\times d$
$D\times n$
$Z=W^TX$

目标：最大化投影后的方差

$\max_w \frac1n \sum_{i=1}^n (z_i-\bar z)^2 \\ s.t. ||W||^2=I \\$

解

$\begin{aligned} Tar&=\max_w \frac1n \sum_{i=1}^n (z_i-\bar z)^2 \\ &=\frac1n \sum_{i=1}^n(w^Tx_i-w^T\bar x_i)^2 \\ &=\frac1n \sum_{i=1}^n(w^T(x_i-\bar x_i))^2 \\ &=\frac1n \sum_{i=1}^n(w^T(x_i-\bar x_i)(x_i-\bar x_i)^Tw) \\ &=\frac1n w^T\sum_{i=1}^n(x_i-\bar x_i)(x_i-\bar x_i)^Tw \\ &=\frac1n w^TCov(X)w \end{aligned}$
$s.t. ||w||^2=1$

拉格朗日

$\begin{aligned} L(w,\lambda)&=\frac1n w^TCov(X)w +\lambda(||w||^2-1)\\ &=\frac1n w^TCov(X)w +\lambda(w^Tw-1)\\ \frac{\partial L}{\partial w}&=\frac{2}{n}Cov(X)w+2\lambda w \end{aligned}$

令 $\frac{\partial L}{\partial w}=0$ 得

$Cov(X)w=\lambda w$

代入Tar

$Tar=\frac1n w^T\lambda w$

$\lambda$ 是常数

$Tar=\frac1n \lambda w^Tw$

$w^Tw=1$

$Tar=\frac1n \lambda$

常数乘常数等于常数

$Tar=\lambda$

最终要最大化的是一个常数 $\lambda$

$\lambda$ 是什么

$Cov(X)w=\lambda w$

$\lambda$ 就是 $C o v (X)$ 的特征值，而我们要最大化 $\lambda$ ，就是对 $C o v (X)$ 进行特征值分解，然后找到最大的特征值，这个最大的特征值对应的特征向量即 $w$

现在只找到一个投影方向 $w$ ，我们要找到d个投影方向才能将原数据降到d维

像上面这样我们已经找到第一个投影方向 $w_1$ 了，我们要找的第二个投影方向 $w_2$ ，先给 $w_2$ 加一点约束条件， $w_1\cdot w_2=0$ ，或写成 $w_1^Tw_2=0$ ，即 $w_1$ 与 $w_2$ 正交，
$Tar=\frac1n w_2^TCov(X)w_2$
$s.t. ||w_2||^2=1,w_1^Tw_2=0$

拉格朗日

$\begin{aligned} L(w,\lambda)&=\frac1n w_2^TCov(X)w_2 +\alpha(||w_2||^2-1)+\beta(w_1^Tw_2-0)\\ &=\frac1n w_2^TCov(X)w_2 +\alpha(w_2^Tw_2-1)+\beta(w_1^Tw_2-0)\\ \frac{\partial L}{\partial w_2}&=\frac{2}{n}Cov(X)w_2+2\alpha w_2+\beta w_1 \end{aligned}$

令 $\frac{\partial L}{\partial w_2}=0$ 得

$Cov(X)w_2=\alpha w_2+\beta w_1$
$\alpha,\beta$ 都是常数可以把 $\frac2n,+,-$ 什么的都吸收进去，所以上式没错

然后呢这条式子说明 $Cov(X)w_2由w_2和w_1$ 线性表示，因为 $Cov(X)w_2$ 在 $w_2$ 方向上，而 $w_1$ 与 $w_2$ 正交，所以 $Cov(X)w_2=\alpha w_2$ ， $\beta=0$

同上面一样我们也是要最大化这个 $\alpha$

因为最大的特征值已经是对应第一个特征向量的了，因此我们要选的是第二大特征值，它所以对应的特征向量就是我们的第二个投影方向 $w_2$

同理我们可以一直找到d个投影方向

这d个投影方向就是我们对 $C o v (X)$ 进行特征分解后前d个最大的特征值所对应的特征向量

有了投影向量矩阵 $W$ 后我们就可以通过 $W^TX$ 得到降到d维后的数据 $Z$ 了

0ng

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
PCA推导

Z:d×nZ: d\times nZ:d×nW:D×dW: D\times dW:D×dX:D×nX: D\times nX:D×nZ=WXZ=WXZ=WX目标：最大化投影后的方差max⁡w1n∑i=1n(zi−zˉ)2s.t.∣∣W∣∣2=I\max_w \frac1n \sum_{i=1}^n (z_i-\bar z)^2 \\s.t. ||W||^2=I \\wmaxn1i=1∑n(zi−zˉ)2s.t.∣∣W∣∣2=I解Tar=max⁡w1n∑i=1n(zi−zˉ)2=1
复制链接

扫一扫