PCA方法，自编码模型（AE，SAE，DSAE等）

最新推荐文章于 2024-07-11 10:47:26 发布

冰鋒

最新推荐文章于 2024-07-11 10:47:26 发布

阅读量8.7k

点赞数 6

分类专栏：机器学习文章标签： sae 自编码

本文链接：https://blog.csdn.net/lmm6895071/article/details/78793041

版权

机器学习专栏收录该内容

15 篇文章 3 订阅

订阅专栏

- PCA
- AE
- SAE
- DAE
- CAE
- SDAE
- VAE

自编码模型，是非监督方法，能够完成特征的压缩和提取；
PCA是线性降维方法，是自编码模型的基础；

1. PCA

PCA 是主成分分析方法，主要是用来数据预处理，降低维度，提取关键的特征（去除冗余的特征）；
首先回顾一下协方差：协方差反应出两两维度之间的关联，越大越关联；

$c o v (X, Y) = E [(X - E (X)) (Y - E (Y))] = E [X Y] - E [X] E [Y]$ $\mathcal cov(X,Y)=E[(X-E(X))(Y-E(Y))]=E[XY]-E[X]E[Y]$
方差：
$D (X) = E [(X - E (x)) 2] = E [X 2] - (E [x]) 2$ $D(X)=E[(X-E(x))^2]=E[X^2]-(E[x])^2$
相关系数： (协方差的标准化)
相关系数主要是说明X，Y之间的线性相关性，当 $rho>0$ ，正相关；等于0，不相关，负数负相关；
$ρ = c o v ( X , Y ) σ X σ Y$ $\rho =\frac{cov(X,Y)}{\sigma_X \sigma_Y}$
为什么是线性线性呢？
首选我们假设 $Y=aX+b$ ，那么 $cov(X,Y)=aD(x)$ ,分母是 $|a|D(x)$ ,所以 $\rho$ 取决于系数a的正负；

实例：
对于原始样本x，我们对其进行编码

c = f (x)

$c=f(x)$ , 最后再构造一个解码函数

x≈g(c)=g(f(x)) $x\approx g(c)=g(f(x))$ ,定义

g(x)=Dc $g(x)=Dc$ ,那么，我们最小化损失函数：

min c | x - D c | 2

$\min_c |x-Dc|^2$
通过对c求导为零， 我们可以得到

c=DTx $c=D^Tx$ ,这就是我们的编码函数；

进一步地，给定 $X$ ,我们得到其协方差矩阵 $C_x=\frac{1}{n}XX^T$ ,n 是特征维度；
我们引入编码函数D， $Y=PX$ ,构造Y的协方差矩阵；

C y = 1 n Y Y T = P C X P T

$C_y=\frac{1}{n}YY^T=PC_XP^T$
我们希望Y的特征间的关联小，即

Cy $C_y$ 中的对角线值尽可能的大，其余位置为零，变成对角矩阵；

基于特征分解的方式：
$C_x$ 是对称矩阵，那么我们可以分解成： $C_x=S\Lambda S^{-1}=S \Lambda S^T$ , 令 $P=S^T$ ，那么：

$C y = P C x P T = P S Λ S T P T = P P - 1 Λ P P - 1 = Λ$ $C_y=P C_xP^T=PS\Lambda S^T P^T=PP^{-1}\Lambda P P^{-1}=\Lambda$
由上可知，我们的目标就是求得 $C_x$ 的特征向量，和特征值；

基于SVD分解的方式
一个矩阵可以分解成三个矩阵相乘的形式：

$M = U Σ V T$ $M=U\Sigma V^T$
因此有：
$M M T = U Σ V T V Σ T U T = U Σ Σ T U T$ $MM^T=U \Sigma V^TV\Sigma^TU^T=U\Sigma \Sigma^TU^T$
$M T M = V Σ T U T U Σ V T = V Σ T Σ V T$ $M^TM=V\Sigma^TU^TU \Sigma V^T=V\Sigma^T \Sigma V^T$
现在令 $Y=\frac{1}{\sqrt{n}}X^T$ ,那么
$Y T Y = 1 n X X T = C x = V Σ T Σ V T$ $Y^TY=\frac{1}{n}XX^T=C_x=V\Sigma^T \Sigma V^T$
因此，我们可以直接对Y进行矩阵分解，获得的V 就是所需要的P；

2. AE

自编码模型AutoEncode，只有一层隐藏层；尽可能的复现原始信号，是PCA的扩展，获取有效的特征；

3.SAE

Sparse AutoEncode 稀疏自编码模型，目的是抑制一些神经元的活性，使得code层更加的稀疏；

4.DAE

Denoising AutoEncoders降噪自动编码器;
在原始的文本中加入噪音，提高其泛化能力，鲁棒性高；
加入训练数据加入噪声，DAE必须学习去去除这种噪声而获得真正的没有被噪声污染过的输入。 DAE可以通过梯度下降算法去训练。
一般上，我们将原始文档一式二份，一份加入噪声，然后进行训练；最后可以使用KL散度进行度量；

5. CAE

Contractive auto-encoders
收缩编码模型，在损失函数中加入W的正则项；

6. SDAE

Stack Denoising AutoEncoders;栈式降噪变=自动编码器；
>本质上就是将原来的一层结构拓展，类似栈结构；

7. VAE

变分自动编码；标准的编码器不能获得新的特征，即不会进行合理的推测而产生有效的结果；（GAN网络类比）；
在AE上，强迫潜在变量服从高斯分布，这样经过采样，产生一些新的特征；

参考文献：
http://blog.csdn.net/hjimce/article/details/49106869
VAE： http://www.cnblogs.com/huangshiyu13/p/6209016.html

冰鋒

关注

6
点赞
踩
48

收藏

觉得还不错? 一键收藏
0
评论
PCA方法，自编码模型（AE，SAE，DSAE等）

PCAAESAEDAECAESDAEVAE 自编码模型，是非监督方法，能够完成特征的压缩和提取； PCA是线性降维方法，是自编码模型的基础；1. PCA PCA 是主成分分析方法，主要是用来数据预处理，降低维度，提取关键的特征（去除冗余的特征）；首先回顾一下协方差：协方差反应出两两维度之间的关联，越大越关联； cov(X,Y)=E[(X−E(X))(Y−E
复制链接

扫一扫

专栏目录