IWAE

IMPORTANCE WEIGHTED AUTOENCODERS

这篇文章主要是提出一种更紧的 E L B O ELBO ELBO L k ( x ) = E h 1 , … , h k ∼ q ( h ∣ x ) [ log ⁡ 1 k ∑ i = 1 k p ( x , h i ) q ( h i ∣ x ) ] \mathcal{L}_{k}(\mathbf{x})=\mathbb{E}_{\mathbf{h}_{1}, \ldots, \mathbf{h}_{k} \sim q(\mathbf{h} | \mathbf{x})}\left[\log \frac{1}{k} \sum_{i=1}^{k} \frac{p\left(\mathbf{x}, \mathbf{h}_{i}\right)}{q\left(\mathbf{h}_{i} | \mathbf{x}\right)}\right] Lk(x)=Eh1,,hkq(hx)[logk1i=1kq(hix)p(x,hi)]其中 w i = p ( x , h i ) / q ( h i ∣ x ) w_{i}=p\left(\mathbf{x}, \mathbf{h}_{i}\right) / q\left(\mathbf{h}_{i} | \mathbf{x}\right) wi=p(x,hi)/q(hix),可以证明 L k = E [ log ⁡ 1 k ∑ i = 1 k w i ] ≤ log ⁡ E [ 1 k ∑ i = 1 k w i ] = log ⁡ p ( x ) \mathcal{L}_{k}=\mathbb{E}\left[\log \frac{1}{k} \sum_{i=1}^{k} w_{i}\right] \leq \log \mathbb{E}\left[\frac{1}{k} \sum_{i=1}^{k} w_{i}\right]=\log p(\mathbf{x}) Lk=E[logk1i=1kwi]logE[k1i=1kwi]=logp(x) k = 1 k=1 k=1时,就等价为一般VAE的 E L B O ELBO ELBO。可以发现随着 k k k的增加, E L B O ELBO ELBO更紧 log ⁡ p ( x ) ≥ L k + 1 ≥ L k \log p(\mathbf{x}) \geq \mathcal{L}_{k+1} \geq \mathcal{L}_{k} logp(x)Lk+1Lk这个同样是一个无偏估计。同样可以使用重参数,其梯度估计如下 ∇ θ L k ( x ) = ∇ θ E h 1 , … , h k [ log ⁡ 1 k ∑ i = 1 k w i ] = ∇ θ E ϵ 1 , … , ϵ k [ log ⁡ 1 k ∑ i = 1 k w ( x , h ( x , ϵ i , θ ) , θ ) ] = E ϵ 1 , … , ϵ k [ ∇ θ log ⁡ 1 k ∑ i = 1 k w ( x , h ( x , ϵ i , θ ) , θ ) ] = E ϵ 1 , … , ϵ k [ ∑ i = 1 k w ~ i ∇ θ log ⁡ w ( x , h ( x , ϵ i , θ ) , θ ) ] \begin{aligned} \nabla_{\boldsymbol{\theta}} \mathcal{L}_{k}(\mathbf{x})=\nabla_{\boldsymbol{\theta}} \mathbb{E}_{\mathbf{h}_{1}, \ldots, \mathbf{h}_{k}}\left[\log \frac{1}{k} \sum_{i=1}^{k} w_{i}\right] &=\nabla_{\boldsymbol{\theta}} \mathbb{E}_{\boldsymbol{\epsilon}_{1}, \ldots, \boldsymbol{\epsilon}_{k}}\left[\log \frac{1}{k} \sum_{i=1}^{k} w\left(\mathbf{x}, \mathbf{h}\left(\mathbf{x}, \boldsymbol{\epsilon}_{i}, \boldsymbol{\theta}\right), \boldsymbol{\theta}\right)\right] \\ &=\mathbb{E}_{\boldsymbol{\epsilon}_{1}, \ldots, \boldsymbol{\epsilon}_{k}}\left[\nabla_{\boldsymbol{\theta}} \log \frac{1}{k} \sum_{i=1}^{k} w\left(\mathbf{x}, \mathbf{h}\left(\mathbf{x}, \boldsymbol{\epsilon}_{i}, \boldsymbol{\theta}\right), \boldsymbol{\theta}\right)\right] \\ &=\mathbb{E}_{\boldsymbol{\epsilon}_{1}, \ldots, \boldsymbol{\epsilon}_{k}}\left[\sum_{i=1}^{k} \widetilde{w}_{i} \nabla_{\boldsymbol{\theta}} \log w\left(\mathbf{x}, \mathbf{h}\left(\mathbf{x}, \boldsymbol{\epsilon}_{i}, \boldsymbol{\theta}\right), \boldsymbol{\theta}\right)\right] \end{aligned} θLk(x)=θEh1,,hk[logk1i=1kwi]=θEϵ1,,ϵk[logk1i=1kw(x,h(x,ϵi,θ),θ)]=Eϵ1,,ϵk[θlogk1i=1kw(x,h(x,ϵi,θ),θ)]=Eϵ1,,ϵk[i=1kw iθlogw(x,h(x,ϵi,θ),θ)]其中 w i ~ = w i / ∑ i = 1 k w i \widetilde{w_{i}}=w_{i} / \sum_{i=1}^{k} w_{i} wi =wi/i=1kwi。利用MC估计梯度 ∑ i = 1 k w i ~ ∇ θ log ⁡ w ( x , h ( ϵ i , x , θ ) , θ ) \sum_{i=1}^{k} \widetilde{w_{i}} \nabla_{\boldsymbol{\theta}} \log w\left(\mathbf{x}, \mathbf{h}\left(\boldsymbol{\epsilon}_{i}, \mathbf{x}, \boldsymbol{\theta}\right), \boldsymbol{\theta}\right) i=1kwi θlogw(x,h(ϵi,x,θ),θ)IWAE采用的方法为REINFORCE-like,而不能像VAE那样对 K L KL KL部分进行解析分析。
在这篇文章中,引入了一个多层的隐藏变量,即为 p ( x ∣ θ ) = ∑ z 1 , … , z L p ( z L ∣ θ ) p ( z L − 1 ∣ z L , θ ) ⋯ p ( x ∣ z 1 , θ ) q ( z ∣ x ) = q ( z 1 ∣ x ) q ( z 2 ∣ z 1 ) ⋯ q ( z L ∣ z L − 1 ) \begin{array}{c}{p(\mathbf{x} | \boldsymbol{\theta})=\sum_{\mathbf{z}^{1}, \ldots, \mathbf{z}^{L}} p\left(\mathbf{z}^{L} | \boldsymbol{\theta}\right) p\left(\mathbf{z}^{L-1} | \mathbf{z}^{L}, \boldsymbol{\theta}\right) \cdots p\left(\mathbf{x} | \mathbf{z}^{1}, \boldsymbol{\theta}\right)} \\ {q(\mathbf{z} | \mathbf{x})=q\left(\mathbf{z}^{1} | \mathbf{x}\right) q\left(\mathbf{z}^{2} | \mathbf{z}^{1}\right) \cdots q\left(\mathbf{z}^{L} | \mathbf{z}^{L-1}\right)}\end{array} p(xθ)=z1,,zLp(zLθ)p(zL1zL,θ)p(xz1,θ)q(zx)=q(z1x)q(z2z1)q(zLzL1)
在这里插入图片描述
这个模型在之后的Ladder-VAE会再次提到。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值