GAN 发展历程

最新推荐文章于 2024-10-13 20:20:41 发布

AREH

最新推荐文章于 2024-10-13 20:20:41 发布

阅读量8.3k

点赞数 18

分类专栏：人工智能文章标签： gan

本文链接：https://blog.csdn.net/qq_19272431/article/details/93380342

版权

人工智能专栏收录该内容

2 篇文章 0 订阅

订阅专栏

这几年出现的比较有影响力的 GAN，从最初的 Goodfellow 版 GAN 到近来大火的 BigGAN、StyleGAN 等，博客的后续内容也是按照这张图的顺序进行的。

GAN 路线图。

Goodfellow 版 GAN

GAN 是由 Goodfellow 等人于 2014 年提出的（目前公认的说法）。其基本思想可以概括为：

GAN 包含两个神经网络，一个神经网络尝试生成真实的数据（主要是图片，也可能是其他数据的分布），而另一个网络尝试判别真实的和生成的数据。

标准的生成对抗网络结构。

这场「猫捉老鼠」的游戏会一直继续下去，直到系统达到所谓的「平衡」，即生成器生成的数据以假乱真到判别器无法判别。

Goodfellow 等人 2014 年提出的 GAN 生成的图像。

论文地址：https://arxiv.org/abs/1406.2661
代码实现地址：https://github.com/goodfeli/adversarial
其他资源：https://arxiv.org/abs/1701.00160

DCGAN: 深度卷积生成对抗网络

DCGAN 的思路可以简单概括为：

卷积神经网络=处理图像效果好
生成对抗网络=生成数据效果好
⟹卷积神经网络+生成对抗网络=生成图像效果好

标准的 GAN 使用多层感知机作为网络结构。但是考虑到卷积神经网络在获取图像特征方面的效果，DCGAN 采用了它作为主要网络结构。同时，DCGAN 稍微做了一些调整，使用了转置卷积操作（transposed convolution operation），它的另一个名字是 Deconvolution。转置卷积帮助图像从低清晰度向高清晰度转换，同样的，采用多层转置卷积可以使图像变得生动多彩。

卷积核的工作原理。通过卷积方式将稀疏的图像矩阵转换为密集矩阵。

DCGAN 生成的图片。较 GAN 更清晰，有更多色彩。

论文地址：https://arxiv.org/abs/1511.06434
代码实现地址：https://github.com/floydhub/dcgan
其他资源：https://towardsdatascience.com/up-sampling-with-transposed-convolution-9ae4f2df52d0

CGAN: 条件生成对抗网络

原始的 GAN 从噪声中生成图片。因此，如果训练的是一类图（例如，狗），其能生成这一类图片。但是，如果训练中同时有很多类（例如，狗和猫都有）图片，则生成的图片是这些图片模糊的混合。而 CGAN 可以让用户指定生成的图片分类。

具体的，CGAN 将 one-hot 向量 y 和随机噪声向量 z 拼接，组成如下的结构：

使用 CGAN 可以生成指定的 MNIST 数字。

论文地址：https://arxiv.org/abs/1411.1784 (https://arxiv.org/abs/1511.06434)
代码实现地址：https://github.com/PacktPublishing/Advanced-Deep-Learning-with-Keras (https://github.com/floydhub/dcgan)
其他资源：https://wiseodd.github.io/techblog/2016/12/24/conditional-gan-tensorflow/

CycleGAN

利用 GAN 变体 CycleGAN 进行风格迁移。

GAN 不仅可以用来生成图像，还可以创造「马+斑马」这种叠加效果的图像，CycleGAN 解决的就是这种问题，即图像到图像的转换。

CycleGAN 包含两个生成器（G 和 F）和两个判别器（D_X 和 D_Y）。G 从 X 中得到一张图像，并尝试将其映射到 Y 中的某个图像。判别器 D_Y 预测一张图像究竟是由 G 生成的还是 Y 中的真实图像。

F 也进行类似的操作，即从 Y 中得到一张图像，并尝试将其映射到 X 中的某个图像。判别器 D_X 预测一张图像究竟是由 F 生成的还是 X 中的真实图像。

所有四个网络都是用普通 GAN 的方式训练的，直到得到强大的生成器 G 和 F，生成的图像分别骗过 D_X 和 D_Y。

CycleGAN 的结构。

利用 CycleGAN 将画家的画风移植到照片上。