生成式对抗网络GAN(无监督)
GAN由Goodfellow在2014年提出,启发自博弈论中的二人零和博弈。由一个生成模型G和一个判别模型D组成。生成模型捕捉样本数据的分布,判别模型是一个二分类器,判别输入的数据是真实数据还是生成的数据。G和D一般都是非线性映射函数,例如多层感知器、卷积神经网络等。
生成模型输入的是一个服从某一简单分布(高斯分布)的噪声变量z,输出的是与训练图像相同尺寸的伪图像;
判别模型输入的是真实图像和伪图像,输出的是一个置信度(概率值0-1),表示判别输入中伪图像是真实图像的概率
对于生成模型G来说要尽可能的欺骗D,使D输出高概率(误判为真实样本);对D来说要尽可能输出低概率,从而形成对抗。
GAN的优化过程是一个“二元极小极大博弈”问题:
作者后来又提出一个改进版本,即: log D(x)-log(D(G(z)))
固定模型G,训练网络D使得最大概率的分对训练样本的标签,即最大化 log D(x)+log(1-D(G(z)))
固定网络D,训练网络G使得最小化 log(1-D(G(z))),即最大化D的损失
D和G同时训练,训练时固定一方,更新另一方的网络参数,交替迭代,使得对方的错误最大化,最终,G能估计出样本数据的分布。