GAN目标函数的理解
GAN的目标函数如下:
当我第一次看到这个目标函数的时候,确实是有点一脸懵逼的。那么如何理解这个函数呢?首先来理解一下这里的
D
(
x
)
\ D(x)
D(x) 的含义。
D ( x ) \ D(x) D(x)是一个概率分布,所代表的含义是:将x分类为真实数据,而非生成数据的概率。也就是说,当自变量x表示真实的样本, D ( x ) \ D(x) D(x)就表示把真样本分类成真的概率;当自变量x表示生成的样本(假样本)时, D ( x ) \ D(x) D(x)就表示把生成的(假的)样本分类成真的概率。
有了
D
(
x
)
\ D(x)
D(x)的概念,让我们来吧目标函数拆成两项来看。第一项为:
这一项里面,自变量x表示的是真实数据,而对数函数不改变函数的单调性,所以这一项就表示把真的分类成真的的概率。
第二项为:
这一项里面,
D
(
G
(
z
)
)
\ D(G(z))
D(G(z))表示把假的样本分类成真的的概率,所以1-
D
(
G
(
z
)
)
\ D(G(z))
D(G(z))就可以用来描述把假的样本分类成假的的概率。
那么基于上述描述,我们换个角度来看GAN网络的目标函数:
也就是说,整个GAN的目标函数描述的是一种** ”把真样本分类成真的,把假样本分类成假的“的能力 **。
对于鉴别器来说,这个能力越高,就表示鉴别器的效果越好,所以鉴别器的参数优化过程就是一个将目标函数最大化的过程,即:
优化好鉴别器后,接下来就要固定鉴别器的参数,然后优化生成器的参数,当鉴别器参数固定时,目标函数的第一项就变成了常数,调整生成器参数的时候就只有第二项在变化。而第二项表示把假样本分类成假的能力,对于生成器来说,肯定这个能力是越小越好才行,这样生成器才能欺骗鉴别器。所有对于生成器的优化就是一个目标函数最小化的过程。
这就是为什么整个GAN网络优化是一个min max的过程。在实际的网络训练当中,也是先训练判别器D,然后固定D的参数训练生成器G的的过程。
参考文献:
[1]: 王梓炫. FLOWGAN:基于生成对抗网络的加密流量识别关键技术研究[D].南京邮电大学,2020.