1.GAN:提出GAN的模型框架
2.CGAN:GAN本来是一个无监督模型,CGAN将GAN拉回监督学习领域。
3.DCGAN:采用CNN结构实现GAN模型。
4.Improved Techniques for Training GANs:提出很多建立一个GAN结构的建议,理解GAN不稳定性的原因,给出稳定训练DCGANs的建议,如特征匹配(feature matching),最小批次判别(minibatch discrimination),单边标签平滑(one-sided label smoothing)、虚拟批归一化(virtual batch normalization),应用在DCGAN上。
5.Pix2Pix:实现图像转换的应用。语义图转街景、黑白图片上色、素描图变真实照片。
使用到PatchGAN模型、U-Net结构,结合ResNet中的skip connection。
问题:训练数据必须成对,即需要原图片和对应转换后的图片,数据集非常难找。
6. CycleGAN:解决Pix2Pix的问题,仅需两个领域的数据集,不需要一一对应。提出循环一致性(Cycle-Consistency)损失函数
可实现普通马和斑马的转换、风格迁移。
7. Progressively Growing of GANs:提出了如何解决由于目标图片尺寸导致的不稳定问题。
8. StackGAN:采用先验知识以及多尺度方法。StackGAN通过一个文本向量来引入文本信息,并提取一些视觉特征。
9. BigGAN:当前ImageNet上图片生成最好的模型。很难复现,结合了自注意力机制、谱归一化(Spectral Normalization)
10. StyleGAN:难复现。借鉴Adaptive Instance Normalization(AdaIN)的自然风格转换技术,来控制隐空间变量z。但有很多有趣想法。
//待读完具体再总结