本文主要是参照苏大神的博客变分自编码器(一):原来是这么一回事 - 科学空间|Scientific Spaces记录的学习笔记,因为VAE很不好懂,数学概率比较多,所以特意记录一下看看自己到底有没有看明白VAE.
符号说明
真实数据:,
;
样本的分布:
;
潜变量:
从潜变量采样生成的数据
VAE的传统理解
当我们有一批数据样本时,我们希望根据得到
的分布
,那样就可以根据
来采样,生成所有的可能的样本。但是根据
得到
的分布
过于理想,通过条件概率
可以转化这个问题,即由潜变量
来生成
的模型。在VAE中假定潜变量
服从标准正态分布,即
,先从标准正态分布中采样一个
,然后根据
来生成一个
,如下图所示,在苏大神的博客中就明确指出这种理解是不正确的,因为我们无法知道重新采样出来的
是不是对应着原来的
,这样如果直接最小化真实数据
和生成数据
之间的距离就是不合理的。
苏大神的理解
苏大神明确指出,在整个VAE模型中,我们并没有使用潜变量是正态分布的假设,而是假设后验分布是正态分布。具体而言,就是对于一个真实样本
,我们假设存在一个专属于
的分布
,并且假设这个分布式独立的多元的正态分布,这样从这个分布采样得到的
生成的数据就对应着
,这样有多少个
就有多少个正态分布