深度生成模型_VAE

最新推荐文章于 2024-07-17 19:17:29 发布

右边是我女神

最新推荐文章于 2024-07-17 19:17:29 发布

阅读量564

点赞数 1

分类专栏：深度学习基础

本文链接：https://blog.csdn.net/weixin_46365033/article/details/117748743

版权

深度学习基础专栏收录该内容

23 篇文章 4 订阅

订阅专栏

文章目录

Auto-Encoder：在这里插入图片描述

注意：自编码器是一种数据压缩（降维）的方法！

自编码器能否生成新的图像？

在这里插入图片描述
自编码器结构的后半部分可以生成图片，因此我们将其单独提出来。

我们希望的事Decoder可以扮演一个Generator的身份。

在自编码器结构中，输入的隐变量来源于Encoder，这也是基于原始图片得到的向量，那么现在该输入什么样的变量就成为了一个问题。

在这里插入图片描述
因此，自编码器不能自主生成新的图像。

问题：既然Auto-Encoder可以重构原始的输入图像，那么如何生存新的图像呢？
答：在z中加入一定的随机因素。这样的一个随机因素通常服从高斯分布。

这样一个编码器，我们称之为变分自动编码器（Variational Autoencoders，VAE）。也就是说，VAE可以完成生成新的图像的功能。

变分自编码器是从一个分布中采样的，该过程确保了接近真实样本特征的输入特征可以通过解码器得到近似真实样本的样本。

VAE的其他优势

VAE在本质上肯定是学习如何构建隐藏层的，这也是它的特色之一。

我们假设编码器生成的分布是正态分布。之所以采用分布的形式表示，是因为可以很自然地表达潜在空间的全局正则化和局部正则化。

变分自动编码器

整体架构

两种解释：

假设潜在变量z服从某种先验分布（高斯分布）。模型训练完毕后，可以从这种先验分布中采样得到潜在变量，然后在解码器中得到新的样本。
在自动编码器基础上加入了随机因子。

变分自动编码器对Encoder增加了约束，强制其产生的隐含变量服从某种分布。

总的来说，编码过程将输入数据编码变成分布而不是一些点。

整体训练过程为：

将数据编码成分布；
从隐藏分布中采样数据点；
解码还原数据并计算重构损失；
将重构损失反向传播。

在这里插入图片描述

隐藏层部分

在这里插入图片描述
我们根据训练集(一个batch)得到样本均值和方差，假设其为正态分布。之后再从中采样，得到新的Z，我们根据这个结果生成新的X。

以上这个想法以及图片是存在问题的。

首先，我们无法得知得到的Z是否还与原来的X对应；其次，在这样的考量下，计算重构误差的意义何在？

在这样的想法当中，我们是假设Z的分布服从正态分布。实际上，这是有偏差的。我们应该假设分布 $p(Z|X_k)$ 这样一个后验分布是正态分布，这个分布是专属于每一个样本的，目的是为了有一个对应关系，为后续计算重构误差提供便利和依据。下图才是，VAE的真实原理图：

在这里插入图片描述

那么我们如何找出专属于 $X_k$ 的均值和方差呢？
我们构建了均值神经网络和方差神经网络来计算出均值和方差。
于是，我们就完成了分布的构建。
值得一提的是，这样两个神经网络应该是各样本通用的。
其中 $\mu_k=f_1(X_k)$ ， $\log{\sigma^2}=f_2(X_k)$ 。
为什么要选择对数函数来表示方差呢？
这是因为 $\sigma^2$ 非负数，这样还要加个激活函数才行。