VAE 根据变分推断会得到 关于 p θ ( x ∣ z ) p_{\theta}(x|z) pθ(x∣z)的log-likehood 的reconstruction term, 为啥这个term 会被称为reconstruction term 呢,还是得回到最大似然估计,因为最大似然估计要求找到最优的参数 θ ∗ \theta* θ∗ ,在这个参数下,使得出现 x x x的概率是最大的。