变分自编码器VAE(Variational Autoencoders)及示例代码

最新推荐文章于 2024-05-20 22:29:07 发布

南阁风起

最新推荐文章于 2024-05-20 22:29:07 发布

阅读量1.4w

点赞数 17

分类专栏：算法基础文章标签： VAE 变分自编码器生成模型人工智能

本文链接：https://blog.csdn.net/qq_27465499/article/details/86775426

版权

这里写一个中文版快速入门笔记，更细致的理论分析和推导见：
Tutorial on Variational Autoencoders

VAE是一个学习复杂分布的无监督学习模型。在实践中，给定数据 $X$ ，我们往往想得到 $P (X)$ ，使得那些真实数据概率较大，而随机噪声概率较小。同时，我们还希望能够生成更多其他类似“真实”的例子，进而丰富我们的数据，典型例子如动画设计等领域，这就是“生成”模型的motivation。

形式化的表述为：已知数据 $X$ 是从某未知真实数据分布 $P_{gt}(X)$ 采样而来，我们的目标是学习一个可采样模型 $P$ ，且 $P$ 和 $P_{gt}(X)$ 尽可能相似。

潜变量模型

真实数据 $X$ 可能是高维的，并且依赖关系复杂，潜变量模型将问题按步骤分解：首先假设有一潜变量 $z\in Z$ ， $Z$ 是隐空间，易于根据概率密度函数 $P (z)$ 采样；其次，假定有一族函数 $X'=f(z;\theta)$ ，将 $z$ 映射为数据 $X^{'}$ 。其中， $z$ 为随机变量， $\theta$ 为固定参数， $X^{'}$ 为与真实数据 $X$ 类似的"新"数据。

学习的目的就是要优化 $\theta$ ，目标为最大化真实数据 $X$ 的概率：
$P(X)=\int P(X|z;\theta)P(z)dz$ 其中 $P(X|z;\theta)=N(X|f(z,\theta),\sigma^2 * I)$

注意到生成分布选择的是Guass分布。其他分布也可以，但需要满足： $P(X|z;\theta)$ 可计算且在 $\theta$ 处连续，可通过梯度下降进行优化。
当不使用潜变量生成模型，直接取确定性的 $X^{'} = f (z; θ)$ 时，相当于生成分布是一个Dirac delta分布，在 $\theta$ 上不连续。此时模型就是传统自编码器模型，它是点对点的，可以进行压缩降维，但不具备直接生成功能（其他未知的 $z^{'}$ 对应的 $X^{'}$ 是什么完全不清楚）。实际上，变分自编码器和传统自编码器只是在网络结构上有一定的相似之处，但本质完全不同。

变分自编码器

在潜变量模型的基础上，还需处理两个问题：

$P (z)$ 的选择，事实上，任意 $d$ 维分布都可由 $d$ 个正态分布的变量通过足够复杂的函数映射而成，只需取 $P (z) = N (0, I)$ 即可，进一步的说明可参见原文。
将上面的优化目标 $P (X)$ 转化为可计算梯度的Loss Function，这就用到变分自编码器的另一个核心方法——变分法。

考虑直接使用蒙特卡洛方法： $\approx \frac{1}{n}\sum_iP(X|z_i)$ ，有两个弊端：1) 复杂的问题对于采样的样本量需求过大ÿ

最低0.47元/天解锁文章

南阁风起

关注

17
点赞
踩
83

收藏

觉得还不错? 一键收藏
2
评论
变分自编码器VAE(Variational Autoencoders)及示例代码

这里写一个中文版快速入门笔记，更细致的理论分析和推导见：Tutorial on Variational AutoencodersPs: 内容有点多，可能会花一点时间来写一个简单的VAE代码：...
复制链接

扫一扫