详见https://blog.csdn.net/mr_tyting/article/details/79336802
这段公式表示,首先固定生成器,也就是G的网络参数,然后判别器D要使V的值尽可能大,也就是真实样本和造假样本的区别要尽可能大(故意找茬)。然后关于这个V函数的构造其实也挺好理解的,就是想让输入参数服从pdata(真实数据分布)时和参数服从pg(造假数据分布)得有一个相反的趋势。最后生成的判别器网络参数,要使这个V尽可能大。
继续推导:
其中
(因为最后公式推出来发现,max(v)描述了pdata和pg的jensen-shannon散度有关,即描绘了两个量的差异程度)
也就是求下式:
我们:可以 user gradient descent 求 G∗:
总结: