变分自编码器ELBO的求解---随机梯度变分估计（SGVB）

最新推荐文章于 2024-01-17 12:01:01 发布

风吹草地现牛羊的马

最新推荐文章于 2024-01-17 12:01:01 发布

阅读量4.2k

点赞数 7

分类专栏：变分贝叶斯系列机器学习

本文链接：https://blog.csdn.net/mch2869253130/article/details/106725342

版权

机器学习同时被 2 个专栏收录

97 篇文章 5 订阅

订阅专栏

变分贝叶斯系列

22 篇文章 12 订阅

订阅专栏

在变分自编码（VAE）一文中我们已经求解了VAE的ELBO,这里再进一步分析求解ELBO的方法，也就是SGVB估计。

两种形式的ELBO

变分自编码器的ELBO其实有两种形式：
第一种是：
$\tag{1} \begin{aligned} ELBO = & E_{q_{\varphi}(z|x)}[log{p_{\theta}(x, z) \over q_{\varphi}(z|x) }] \\ = & E_{q_{\varphi}(z|x)}[log{p_{\theta}(z)p_{\theta}(x|z) \over q_{\varphi}(z|x)}] \\ = & E_{q_{\varphi}(z|x)}[logp_{\theta}(x|z)] - KL[q_{\varphi}(z|x)||p_{\theta}(z)] \end{aligned}$
第二种是：
$\tag{2} \begin{aligned} ELBO = & E_{q_{\varphi}(z|x)}[log{p_{\theta}(x, z) \over q_{\varphi}(z|x) }] \\ = & E_{q_{\varphi}(z|x)}[log{p_{\theta}(x,z) \over q_{\varphi}(z|x)}] \\ = & E_{q_{\varphi}(z|x)}[logp_{\theta}(x,z)] + H_{q_{\varphi}(z|x)}(z) \\ 其中,H_{q_{\varphi}(z|x)}(z) = & \int_{z}-q_{\varphi}(z|x)logq_{\varphi}(z|x)dz \end{aligned}$

SGVB估计求解ELBO

先求解（1）式，先考虑（1）式中的第一项，第一项式期望的形式，期望可以通过蒙特卡洛估计来求解，不懂的可以看这篇博客蒙特卡洛估计。

从 $q_{\varphi}(z|x)$ 中依据z的概率分布采样L个点，即
$\tag{3}E_{q_{\varphi}(z|x)}[logp_{\theta}(x|z)] \approx {1 \over L}\sum_{l =1}^{L}logp_{\theta}(x|z^{(l)})$
这样通过采样貌似可以，但是我们还要通过采样来反向梯度优化 $\varphi$ ，这样采样之后 $E_{q_{\varphi}(z|x)}[logp_{\theta}(x|z)]$ 就与 $\varphi$ 无关了，因此这个操作是不可导的，就需要重参数化技巧来使采样操作可导。我们假设 $z^{(l)} = g_{\varphi}(x, \varepsilon^{(l)})，\varepsilon^{(l)} \sim p(\varepsilon)$ ，其中 $p(\varepsilon)和g_{\varphi}$ 都是形式已知的。这样（3）式对 $\varphi$ 就可导了，因为 $g_{\varphi}$ 中含有参数 $\varphi$ 。
（3）式就变成了：
$\tag{4} E_{q_{\varphi}(z|x)}[logp_{\theta}(x|z)] \approx {1 \over L}\sum_{l =1}^{L}logp_{\theta}(x|g_{\varphi}(x,\varepsilon^{(l)})) \\ \varepsilon^{(l)} \sim p(\varepsilon)$
（4）式就是用SGVB估计得到的。
所以（1）式可进一步写成
$\tag{5} \begin{aligned} L(\varphi,\theta,x) = & {1 \over L}\sum_{l =1}^{L}logp_{\theta}(x|z^{(l)}) - KL(q_{\varphi}(z|x)||p_{\theta}(z)) \\ = & {1 \over L}\sum_{l=1}^{L}logp_{\theta}(x|g_{\varphi}(x, \varepsilon^{(l)})) -KL(q_{\varphi}(z|x)||p_{\theta}(z)) \\ \end{aligned}$
其中 $\varepsilon^{(l)} \sim p(\varepsilon)$ ，

在实际计算时，我们假设 $p_{\theta}(z)\backsim N(z;0,I)，q_{\varphi}(z|x) \backsim N(z;\mu,\sigma)，z的维度是J$ ，二者的KL散度可以得到解析形式：
在这里插入图片描述

因此，最后（5）式就变成了：

$\tag{6} \begin{aligned} L(\varphi,\theta,x) = {1 \over L}\sum_{l=1}^{L}logp_{\theta}(x|g_{\varphi}(x, \varepsilon^{(l)})) +{1 \over 2} \sum_{j=1}^{J}(1+log(\sigma_{j}^{2})-\mu_{j}^{2}-\sigma_{j}^{2})) \\ 其中\varepsilon^{(l)} \sim p(\varepsilon) \end{aligned}$

风吹草地现牛羊的马

关注

7
点赞
踩
31

收藏

觉得还不错? 一键收藏
1
评论
变分自编码器ELBO的求解---随机梯度变分估计（SGVB）

在变分自编码（VAE）一文中我们已经求解了VAE的ELBO,这里再进一步分析求解ELBO的方法，也就是SGVB估计。两种形式的ELBO变分自编码器的ELBO其实有两种形式：第一种是：ELBO=Eqφ(z∣x)[logpθ(x,z)qφ(z∣x)]=Eqφ(z∣x)[logpθ(z)pθ(x∣z)qφ(z∣x)]=Eqφ(z∣x)[logpθ(x∣z)]−KL[qφ(z∣x)∣∣pθ(z)](1)\tag{1}\begin{aligned}ELBO = & E_{q_{\varphi}(
复制链接

扫一扫