GAN概况
GAN直观理解:造假酒的造假者不断从鉴定师那里得到反馈从而技术不断提升改良制造的假酒越发与真酒无异;鉴定师鉴定技术也随着不断提升。
GAN 由以下两部分组成。
- 生成器网络(generator network):它以一个随机向量(潜在空间中的一个随机点)作 为输入,并将其解码为一张合成图像。
- 判别器网络(discriminator network)或对手(adversary):以一张图像(真实的或合成的均可)作为输入,并预测该图像是来自训练集还是由生成器网络创建。
生成器将随机潜在向量转换成图像,判别器试图分辨真实图像与生成图像。
生成器的训练是为了欺骗判别器。
注意:GAN 的优化最小值是不固定的。通常来说,梯度下降是沿着静态的损失地形滚下山坡。但对于GAN 而言,每下山一步, 都会对整个地形造成一点改变。它是一个动态的系统,其最优化过程寻找的不是一个最小值, 而是两股力量之间的平衡。因此,GAN 的训练极其困难,想要让GAN 正常运行,需要对模型架构和训练参数进行大量的仔细调整。