极简笔记 VAE（变分自编码器）

Hibercraft

于 2018-05-25 22:02:48 发布

阅读量6.6k

点赞数 5

分类专栏：极简笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Hibercraft/article/details/80457445

版权

本文介绍了变分自编码器（VAE）的基本原理，包括变分推断、生成模型、正则化项与重构误差的关系，并通过重参数化技巧解决采样问题，将理论与神经网络模型相结合。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

极简笔记 VAE（变分自编码器）

论文原文：Auto-Encoding Variational Bayes

这是一篇极其拗口的文章，但是文章从变分推断一路延伸到自编码器的构造，过程一气呵成，和当下DL领域的灌水之风形成鲜明对比，是难得的佳作。为了能够从理论到实现融会贯通地理解，本篇笔记会更加偏向于思路解读而非原文复述。

VAE是一个生成模型，对于生成模型，我们希望求得的都是原始数据分布 $p(x)$ 。但是我们有的只是离散的对真实分布的采样 $\{x_1,x_2,x_3, ... ,x_n\}$ ，这就是我们的数据集。这时候我们常常会先假设分布的类型（e.g. 高斯分布，均匀分布），然后用最大似然（ML）来做，计算参数 $\theta=\arg\max_{\theta}\sum_i \log p(x_i)$ ，从而求得 $p_\theta (x)$ 。但是 $p(x)$ 可能是一个很复杂的难以表达的分布，难以选择合适的假设分布来计算最大似然。

于是假设除了可见变量 $x$ ，还存在着潜变量 $z$ ，且 $z$ 满足某个简单的分布 $p(z)$ 。那么原始数据分布可以按照后验概率公式分解成 $p(x)=\int p(x|z)p(z)dz$ ，但是在离散数据情况下边缘化 $z$ 是非常费时的，于是我们想到了变分推断。

$\log p_\theta(x_i)$ 有下界 $L(\theta,\phi;x_i)$ ，这个下界可以进一步拆分：

L (θ, ϕ; x i) = - D K L (q ϕ (z | x i) | | p θ (z)) + E q ϕ (z | x i) [log p θ (x i | z)]

$L(\theta,\phi;x_i)=-D_{KL}(q_\phi(z|x_i)||p_\theta(z))+\mathbb{E}_{q_\phi(z|x_i)}[\log p_\theta(x_i|z)]$

这里非常重要，为了提升下界，等价于减小第一项的KL散度，增加第二项的期望。那么第一项可以看做是对 $q_\phi(z|x_i)$ 的正则项，使其更加接近于先验分布 $p_\theta(z)$ ；第二项可以看做是负重构误差项，当 z

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。