希望找到一个数据集的真实概率分布
现在,并不知道这个分布的数学式子是什么样的,但是可以从这个分布中采样,当收集到一组高质量的图片作为数据集的时候就是从这个真实的分布中采样。
于是现在有了一笔从中采样的数据
{,
,....,
}
然后,希望通过神经网络生成一个概率分布 (
是参数),使得这个概率分布和真实的概率分布
越接近越好,具体该怎么做呢?具体的做法就是求概率分布
的极大似然估计。得到m个样本的可能性,把所有的可能性乘起来,就是总的值L
(1)
L的值越大,代表质量高图片的可能性越大。如何让L的值越大越好,就是要优化这个函数中的参数
(2)
这就是Generator中生成的概率分布中采样m个数据的似然估计,希望它能近似从中采样数据的期望
(3)
为什么(2)式和(3)式近似相等呢?对真实样本进行采样后的期望实际上就是求平均因此(3)式子可以化成下面
(4)
化简后的式子是不是和式子(2)很相似,只不过多除了一个m,但由于m是一个常数,并不影响。
那为什要把式子(3)化成式子(4)呢,实际上化成式子(4)并不是最终目的。
把式子(4)减掉一个式子如下:
这里先说明减掉这个式子后对原本求并没有影响,因为减掉的式子中并不包含
,相当于减掉一个常数。
至于为什么要减掉这个式子,将上述的式子进一步化简:
(5)
于是本来要求极大似然估计式子(2)变成了求KL散度的最小值(5)