深度学习之自编码器（4）变分自编码器

最新推荐文章于 2024-05-30 11:06:27 发布

炎武丶航

最新推荐文章于 2024-05-30 11:06:27 发布

阅读量403

点赞数

分类专栏： TensorFlow2 深度学习文章标签：深度学习神经网络 tensorflow

本文链接：https://blog.csdn.net/weixin_43360025/article/details/120679361

版权

深度学习同时被 2 个专栏收录

125 篇文章 55 订阅

订阅专栏

TensorFlow2

69 篇文章 12 订阅

订阅专栏

深度学习之自编码器（4）变分自编码器

1. VAE原理

基本的自编码器本质上是学习输入

\boldsymbol x

和隐藏变量

\boldsymbol z

之间映射关系，它是一个 判别模型（Discriminative model）， 并不是生成模型（Generative model）。那么能不能将自编码器调整为生成模型，方便地生成样本呢？

给定隐藏变量的分布

\text{P}(\boldsymbol z)

，如果可以学习到条件概率分布

\text{P}(\boldsymbol x|\boldsymbol z)

，则通过对联合概率分布

\text{P}(\boldsymbol x,\boldsymbol z)=\text{P}(\boldsymbol x|\boldsymbol z)\text{P}(\boldsymbol z)

进行采样，生成不同的样本。 变分自编码器（Variational Auto-Encoders，简称VAE）就可以实现此目的，如下图所示：

在这里插入图片描述

VAE模型结构

如果从神经网络的角度来理解的话，VAE和前面的自编码器一样，非常直观好理解；但是VAE的理论推导稍复杂，接下来我们先从神经网络的角度取阐述VAE，再从概率角度去推导VAE。

从神经网络的角度来看，VAE相对于自编码器模型，同样具有编码器和解码器两个子网络。解码器接受输入 $\boldsymbol x$ ，输出为隐变量 $\boldsymbol z$ ；解码器负责将隐变量z解码为重建的 $\bar\boldsymbol x$ 。不同的是，VAE模型对隐变量 $\boldsymbol z$ 的分布有显式地约束，希望隐变量 $\boldsymbol z$ 符合预设的先验分布 $\text{P}(\boldsymbol z)$ 。因此，在损失函数的设计上，除了原有的重建误差项，还添加了隐变量 $\boldsymbol z$ 分布的约束项。

1. VAE原理

从概率的角度，我们假设任何数据集都采样自某个分布 $p(\boldsymbol x|\boldsymbol z)$ ， $\boldsymbol z$ 是隐藏变量，代表了某种内部特征，比如手写数字的图片 $\boldsymbol x$ ， $\boldsymbol z$ 可以表示字体的大小、书写风格、加粗、斜体等设定，它符合某个先验分布 $p(\boldsymbol z)$ ，在给定具体隐藏变量 $\boldsymbol z$ 的情况下，我们可以从学到了分布 $p(\boldsymbol x|\boldsymbol z)$ 中采样一些列的生成样本，这些样本都具有 $\boldsymbol z$ 所表示的共性。

炎武丶航

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度学习之自编码器（4）变分自编码器

深度学习之自编码器（4）变分自编码器1. VAE原理基本的自编码器本质上是学习输入x\boldsymbol xx和隐藏变量z\boldsymbol zz之间映射关系，它是一个判别模型（Discriminative model），并不是生成模型（Generative model）。那么能不能将自编码器调整为生成模型，方便地生成样本呢？给定隐藏变量的分布P(z)\text{P}(\boldsymbol z)P(z)，如果可以学习到条件概率分布P(x∣z)\text{P}(\boldsymbol x|\b
复制链接

扫一扫

专栏目录