【机器学习】主成分分析（PCA）、自编码器（AutoEncode）

TsingPig

于 2024-05-10 17:31:31 发布

阅读量510

点赞数 19

文章标签：机器学习概率论人工智能

本文链接：https://blog.csdn.net/njnu19210217/article/details/138661973

版权

在这里插入图片描述

$\frac{\sum_{i=1}^{n} (x_i - {\mu})^2 }{n}$

在这里插入图片描述

$x^{(i)} 都减去均值 x_{\mu}。$
$x^{(i)}_{proj}=||\vec{x^{(i)} } || \cdot ||\vec{w}|| \cdot \cos \theta = \vec{x^{(i)}} \cdot \vec{w} ，即向量的点乘。$

$Var(x_{proj}) = \frac{\sum_{i=1}^{n} (x^{(i)_{proj} }) ^2 } {n} = \frac{ \sum_{i=1}^{n} (\vec{x^{(i)}} \cdot \vec{w}) ^ 2}{n} = \frac{ \sum_{i=1}^{n} (x^{(i)}_1\cdot w_1 + x^{(i)} _{2} \cdot w_2) ^2}{n}$
如果原向量 $\vec{x}$ 是 $m$ 维的， $Var(x_{proj}) = \frac{ \sum_{i=1}^{n} (x^{(i)}_1\cdot w_1 + x^{(i)} _{2} \cdot w_2 + \cdots +x^{(i)} _{m} \cdot w_m) ^2}{n}$

所以现在问题转变成，给定一组有 $n$ 个的 $m$ 维数据构成的矩阵 $X_{m \times n}$ ，求 $W_{m \times 1}$ 使得
$\frac{1}{n} \sum_{i=1}^{n} (\sum_{j=1}^{m} X_{i,j} \cdot W^{T}_{j}) ^2 最大。$

即
$\frac{1}{n} \cdot \sum_{i=1}^{n}( X^{(i)} \cdot W) ^2 最大。$
记 $f(X)=\frac{1}{n} \cdot \sum_{i=1}^{n}( X^{(i)} \cdot W) ^2$

$\left.\nabla f= \begin{pmatrix}\frac{\partial\mathrm{f}}{\partial\mathrm{W}_1}\\\frac{\partial\mathrm{f}}{\partial\mathrm{W}_2}\\\cdots\\\frac{\partial\mathrm{f}}{\partial\mathrm{W}_m}\end{pmatrix}= \frac{2}{\mathrm{n}}\begin{pmatrix}\sum_{\mathrm{i}=1}^\mathrm{n}\left(\mathrm{X}_1^\mathrm{(i)}W_1+\mathrm{X}_2^\mathrm{(i)}W_2+\ldots+\mathrm{X}_\mathrm{m}^\mathrm{(i)}W_\mathrm{m}\right)\mathrm{X}_1^\mathrm{(i)}\\\sum_{\mathrm{i}=1}^\mathrm{n}\left(\mathrm{X}_1^\mathrm{(i)}W_1+\mathrm{X}_2^\mathrm{(i)}W_2+\ldots+\mathrm{X}_\mathrm{m}^\mathrm{(i)}W_\mathrm{m}\right)\mathrm{X}_2^\mathrm{(i)}\\\cdots\\\sum_{\mathrm{i}=1}^\mathrm{n}\left(\mathrm{X}_1^\mathrm{(i)}W_1+\mathrm{X}_2^\mathrm{(i)}W_2+\ldots+\mathrm{X}_\mathrm{m}^\mathrm{(i)}W_\mathrm{m}\right)\mathrm{X}_\mathrm{m}^\mathrm{(i)}\end{pmatrix}\right.$
即
$\nabla f= \frac{2}{\mathrm{n}}\left(\mathrm{X}^{(1)}W,\ldots,\mathrm{X}^{(\mathrm{n})}W\right)\cdot\left(\begin{array}{c}\mathrm{X}_{1}^{(1)},\mathrm{X}_{2}^{(1)},\ldots,\mathrm{X}_{\mathrm{m}}^{(1)}\\\mathrm{X}_{1}^{(2)},\mathrm{X}_{2}^{(2)},\ldots,\mathrm{X}_{\mathrm{m}}^{(2)}\\\cdots\\\mathrm{X}_{1}^{(\mathrm{n})},\mathrm{X}_{2}^{(\mathrm{n})},\ldots,\mathrm{X}_{\mathrm{m}}^{(\mathrm{n})}\end{array}\right)$