详细了解原始GAN背后的数学原理及其局限性
1.简介
生成对抗网络(GAN)包含两个模型:生成模型G和鉴别模型D。可以将生成模型视为伪造者,该伪造者试图生成假货币并在不被捕获的情况下使用它,而鉴别模型是类似于警察,试图抓住假币。 这场竞争一直持续到造假者变得足够聪明以成功欺骗警察为止。
Figure 1: Representation of the generator and discriminator as a counterfeiter and police, respectively. Figure from [1].
换一种说法,
鉴别器:作用是区分实际数据和生成的(伪)数据。
生成器(Generator):其作用是创建数据,使欺骗者无法使用。
2.一些参数和变量
在推导之前,我们先介绍一些参数和变量。
3.损失函数的推导
Ian Goodfellow等人在原始论文中描述了损失函数。 可以从二进制交叉熵损失的公式得出。 二进制交叉熵损失可以写成:
3.1鉴别器损失
现在,鉴别器的目的是正确分类假数据和真实数据集。 为此,应将等式(1)和(2)最大化,鉴别器的最终损失函数可以表示为:
3.2生成器损耗
在这里,生成器正在与鉴别