深度学习之自编码器（3）自编码器变种

最新推荐文章于 2024-12-22 21:01:01 发布

炎武丶航

最新推荐文章于 2024-12-22 21:01:01 发布

阅读量628

点赞数

分类专栏： TensorFlow2 深度学习文章标签：深度学习神经网络 tensorflow

本文链接：https://blog.csdn.net/weixin_43360025/article/details/120660424

版权

深度学习同时被 2 个专栏收录

125 篇文章

订阅专栏

TensorFlow2

69 篇文章

订阅专栏

本文介绍了自编码器的三种变种：降噪自编码器通过添加噪声强迫网络学习数据本质特征；Dropout自编码器使用Dropout技术防止过拟合；对抗自编码器引入判别器网络，使隐藏变量分布接近预设先验，提高重建质量。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一般而言，自编码器网络训练较为稳定，但是由于损失函数是直接度量重建样本与真实样本的底层特征之间的距离，而不是评价重建样本的逼真度和多样性等抽象指标，因此在某些任务上效果一般，如图片重建，容易出现重建图片边缘模糊，逼真度相对真实图片仍有不小差距。为了尝试让自编码器学习到数据的真是分布，产生了一系列的自编码器变种网络。下面将介绍集中典型的自编码器变种模型。

1. Denoising Auto-Encoder

为了防止神经网络记忆住输入数据的底层特征，Denoising Auto-Encoder给输入数据添加随机的噪声扰动，如给输入 $\boldsymbol x$ 添加采样自高斯分布的噪声 $\varepsilon$ ：
$\tilde\boldsymbol x=\boldsymbol x+ε,ε\sim\mathcal N(0,\text{var})$
添加噪声后，网络需要从 $\tilde\boldsymbol x$ 学习到数据的真实隐藏变量 $\boldsymbol z$ ，并还原出原始的输入 $\boldsymbol x$ ，如下图所示：

Denoising自编码器示意图

模型的优化目标为：
$θ^*=\underbrace{\text{argmin}}_θ \ \text{dist}(h_{θ_2} (g_{θ_1} (\tilde\boldsymbol x)),\boldsymbol x)$

2. Dropout Auto-Encoder

自编码器网络同样面临过拟合的风险，Dropout Auto-Encoder通过随机断开网络的连接来减少网络的表达能力，防止过拟合。Dropout Auto-Encoder实现非常简单，通过在网络层中插入Dropout层即可实现网络连接的随机断开。

3. Adversarial Auto-Encoder

为了能够方便地从某个一致某个已知的先验分布中 $p(\boldsymbol z)$ 采样隐藏变量z，方便利用 $p(\boldsymbol z)$ 来重建输入，对抗自编码器（Adversarial Auto-Encoder）利用额外的判别器网络（Discriminator，简称D网络）来判定降维的隐藏变量 $\boldsymbol z$ 是否采样自先验分布 $p(\boldsymbol z)$ ，如下图所示。判别器网络的输入为一个属于 $[0, 1]$ 区间的变量，表征隐藏向量是否采样自先验分布 $p(\boldsymbol z)$ ：所有采样自先验分布 $p(\boldsymbol z)$ 的 $\boldsymbol z$ 标注为真，采样自编码器的条件概率 $q(\boldsymbol z|\boldsymbol x)$ 的标注 $\boldsymbol z$ 为假。通过这种方式训练，处理可以重建样本，还可以约束条件概率分布 $q(\boldsymbol z|\boldsymbol x)$ 逼近先验分布 $p(\boldsymbol z)$ 。

在这里插入图片描述