AVB

最新推荐文章于 2024-05-29 22:38:14 发布

Ghy817920

最新推荐文章于 2024-05-29 22:38:14 发布

阅读量992

点赞数 1

分类专栏：变分自动编码机

本文链接：https://blog.csdn.net/Ghy817920/article/details/96315953

版权

变分自动编码机专栏收录该内容

9 篇文章 0 订阅

订阅专栏

Adversarial Variational Bayes:Unifying Variational Autoencoders and Generative Adversarial Networks

AVB提出了一个更加灵活的inference模型，具体如下图所示。
在这里插入图片描述
首先回归下VAE，其目标函数为ELBO $\begin{aligned} \log p_{\theta}(x) \geq-\mathrm{KL}\left(q_{\phi}(z | x), p(z)\right) & +\mathrm{E}_{q_{\phi}(z | x)} \log p_{\theta}(x | z) \end{aligned}$ 如果存在一个 $\phi$ 使得 $q_{\phi}(z | x)=p_{\theta}(z | x)$ ，那么 $\begin{aligned} \log p_{\theta}(x)=\max _{\phi}-\mathrm{KL}( & q_{\phi}(z | x), p(z) ) +\mathrm{E}_{q_{\phi}(z | x)} \log p_{\theta}(x | z) \end{aligned}$ 但是一般来说这是不可能的。我们优化的目标一般是 $\mathrm{E}_{p_{\mathcal{D}}(x)} \log p_{\theta}(x)$ ，但是上式是难于直接运算的，往往转化为 $\begin{array}{r}{\max _{\theta} \max _{\phi} \mathrm{E}_{p_{\mathcal{D}}(x)}\left[-\mathrm{KL}\left(q_{\phi}(z | x), p(z)\right)\right.} {+\mathrm{E}_{q_{\phi}(z | x)} \log p_{\theta}(x | z) ]}\end{array}$ 由于 $q_{\phi}(z | x)$ 往往选择为一个易于处理的分布，但这样就限制了模型的灵活性，从而会出现VAE生成的图比较模糊等问题。
下面介绍本文的方法，我们的优化问题为 $\begin{aligned} \max _{\theta} \max _{\phi} \mathrm{E}_{p_{\mathcal{D}}}(x) & \mathrm{E}_{q_{\phi}}(z | x)(\log p(z)-\log q_{\phi}(z | x)+\log p_{\theta}(x | z) ) \end{aligned}$ 本文中采用一种隐含的方式表示 $\log p(z)-\log q_{\phi}(z | x)$ ，从而不能像VAE那样使用重参数和随机梯度进行优化。引入判别网络 $T (x, z)$ ，使得其最优值刚好为 $\log p(z)-\log q_{\phi}(z | x)$ 。具体来说，考虑以下优化问题 $\begin{aligned} \max _{T} \mathrm{E}_{p_{\mathcal{D}}}(x) & \mathrm{E}_{q_{\phi}(z | x)} \log \sigma(T(x, z)) +\mathrm{E}_{p_{\mathcal{D}}(x)} \mathrm{E}_{p(z)} \log (1-\sigma(T(x, z))) \end{aligned}$ 即用 $T (x, z)$ 判别样本 $(x, z)$ 来自 $p_{\mathcal{D}}(x) p(z)$ 还是 $p_{\mathcal{D}}(x) q_{\phi}(z | x)$ 根据GAN的最优判别器 $T^{*}(x, z)=\log q_{\phi}(z | x)-\log p(z)$ 从而目标函数变为 $\max _{\theta, \phi} \mathrm{E}_{p_{\mathcal{D}}(x)} \mathrm{E}_{q_{\phi}(z | x)}\left(-T^{*}(x, z)+\log p_{\theta}(x | z)\right)$ 以上优化目标对 $\theta$ 可以很好地得出梯度，而 $\phi$ 则比较麻烦，因为 $T^{*}(x, z)$ 与 $\phi$ 有关。但是有 $\mathrm{E}_{q_{\phi}(z | x)}\left(\nabla_{\phi} T^{*}(x, z)\right)=0$ 使用重参数，则优化目标可以变为 $\begin{aligned} \max _{\theta, \phi} \mathrm{E}_{p_{\mathcal{D}}(x)} \mathrm{E}_{\epsilon}\left(-T^{*}\left(x, z_{\phi}(x, \epsilon)\right)\right.& +\log p_{\theta}\left(x | z_{\phi}(x, \epsilon)\right) ) \end{aligned}$ 最终算法如下
在这里插入图片描述
但是在实际优化的过程中发现，由于 $p_{\mathcal{D}}(x) p(z)$ 和 $p_{\mathcal{D}}(x) q_{\phi}(z | x)$ 相差甚远，这样一来 $T (x, z)$ 很难训练到最优的判别器，因此文中提出了一种Adaptive Contrast的方式，即引入一个简单的变分后验 $r_{\alpha}(z | x)$ （这个分布设定为一个高斯分布，其均值 $\mu(x)$ 和方差 $\sigma(x)$ 匹配到 $q_{\phi}(z | x)$ 的均值和方差[采用MC方法估计]），让这个分布与 $q_{\phi}(z | x)$ 进行对抗，这样 $T (x, z)$ 就能很容易训到最优，这样一来目标函数变为 $\mathrm{E}_{p_{\mathcal{D}}}(x)\left[-\mathrm{KL}\left(q_{\phi}(z | x), r_{\alpha}(z | x)\right)+\mathrm{E}_{q_{\phi}(z | x)}\left(-\log r_{\alpha}(z | x)+\log p_{\phi}(x, z)\right)\right]$ 将 $T (x, z)$ 代替 $K L$ 部分可得 $\mathrm{E}_{p_{\mathcal{D}}(x)} \mathrm{E}_{q_{\phi}(z | x)}\left(-T^{*}(x, z)-\log r_{\alpha}(z | x)+\log p_{\theta}(x, z)\right)$ 为了简单起见，我们可以利用 $r_{\alpha}(z | x)$ 的高斯性质，可以把 $K L$ 部分变化为以下 $\begin{aligned} \mathrm{E}_{p \mathcal{D}}(x) & \mathrm{KL}\left(\tilde{q}_{\phi}(\tilde{z} | x), r_{0}(\tilde{z})\right) \\ \tilde{z} & :=\frac{z-\mu(x)}{\sigma(x)} \end{aligned}$ 这样便得到了加入AC的算法如下所示。
在这里插入图片描述

Ghy817920

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
AVB

Adversarial Variational Bayes:Unifying Variational Autoencoders and Generative Adversarial NetworksAVB提出了一个更加灵活的inference模型，具体如下图所示。首先回归下VAE，其目标函数为ELBOlog⁡pθ(x)≥−KL(qϕ(z∣x),p(z))+Eqϕ(z∣x)log⁡pθ(x∣z...
复制链接

扫一扫

专栏目录