目录
前言
想要理解什么是变分自编码器,需要先理解什么是变分、变分贝叶斯、变分下界、和将重参数化引入变分下界这四个过程。
变分
可以直观理解为:当一个分布p不容易计算时,我们将一个容易计算的分布作为这个不好计算的分布的近似。
变分贝叶斯
可以直观理解为:变分中不容易计算的分布p为后验分布的情况。
变分下界
l o g p θ ( x i ) = E z ∼ q ϕ ( z ∣ x ) [ l o g p θ ( x i ) ] = E z ∼ q ϕ ( z ∣ x ) [ l o g p θ ( z , x i ) p θ ( z ∣ x i ) ] = E z ∼ q ϕ ( z ∣ x ) [ l o g p θ ( z , x i ) q ϕ ( z ∣ x i ) ] + E z ∼ q ϕ ( z ∣ x ) [ l o g q ϕ ( z , x i ) p θ ( z ∣ x i ) ] = E z ∼ q ϕ ( z ∣ x ) [ l o g p θ ( z , x i ) q ϕ ( z ∣ x i ) ] + D k l ( q ϕ ( z , x i ) ∣ ∣ p θ ( z ∣ x i ) ) = L + D k l ( q ϕ ( z , x i ) ∣ ∣ p θ ( z ∣ x i ) ) ≥ L \begin {aligned} logp_\theta (x^i) &=\Bbb E_{z \sim q_\phi(z|x)}[logp_\theta (x^i)] \\ &= \Bbb E_{z \sim q_\phi(z|x)}[log \frac{p_\theta (z,x^i)}{p_\theta (z|x^i)}] \\ &= \Bbb E_{z \sim q_\phi(z|x)}[log \frac{p_\theta (z,x^i)}{q_\phi (z|x^i)}] + \Bbb E_{z \sim q_\phi(z|x)}[log \frac{q_\phi (z,x^i)}{p_\theta (z|x^i)}] \\ &=\Bbb E_{z \sim q_\phi(z|x)}[log \frac{p_\theta (z,x^i)}{q_\phi (z|x^i)}] +D_{kl}(q_\phi (z,x^i)||p_\theta (z|x^i)) \\ &= \mathcal L+D_{kl}(q_\phi (z,x^i)||p_\theta (z|x^i)) \\ &\geq \mathcal L \end {aligned} logpθ(xi)=Ez∼qϕ(z∣x)[logpθ(xi)]=Ez∼qϕ(z∣x)[logpθ(z∣xi)pθ(z,xi)]=Ez∼qϕ(z∣x)[logqϕ(z∣xi)pθ(z,xi)]+Ez∼qϕ(z∣x)[logpθ(z∣xi)qϕ(z,xi)]=Ez∼qϕ(z∣x)[logqϕ(z∣xi)pθ(z,xi)]+Dkl(qϕ(z,xi)∣∣pθ(z∣xi))=L+Dkl(qϕ(z,xi)∣∣pθ(z∣xi))≥