GAN网络结构
两个模型:两个模型都是多层感知机,第一个先定义输入噪声向量,映射到数据空间,获取生成器对样本数据的分布,并生成虚假样本;第二个输出一个标量,表示样本来自真实数据而不是生成数据的概率
蓝色虚线是判别器D,绿色实线是生成器G生成的虚假数据的分布P(G),黑色虚线是真实数据的分布Px,下方的两个横线表示x=G(z)这个将噪声z映射到x的趋势。从a到d,随着迭代的进行,G的分布越来越接近真实数据,而D最后无法区分G和真实数据,变成一个定值0.5。
损失函数
第一项是D的训练目标,即最大化正确分类的判别概率,第二项是G的最小化训练目标,在实际操作的时候,G训练为最大化。训练目标:G最大化D犯错的概率;D能够判断样本来自真实数据还是生成数据。存在唯一解,即G得到真实数据的分布,D在任意情况下都等于1/2。通过反向传播和dropout训练生成模型和判别模型,生成模型通过前向传播获得样本。
训练
生成器与判别器同时训练,在训练判别器时最小化判别误差,在训练生成器时最大化判别误差。训练好的生成器可以把任意噪声向量转化成和真实数据类似的样本。