GAN、DCGAN、WGAN、SRGAN 演变与改进

最新推荐文章于 2023-05-20 06:12:10 发布

数据派THU

最新推荐文章于 2023-05-20 06:12:10 发布

阅读量540

点赞数

文章标签： python 深度学习机器学习神经网络人工智能

原文链接：https://mp.weixin.qq.com/s?__biz=MzI1MjQ2OTQ3Ng==&mid=2247566927&idx=3&sn=de4a24810a09700686b6d126a083cbac&chksm=e9e0cfc4de9746d224351ac09a88f33698aadeb5ef645757021eee2a9c8d4643da3446b1f1ad&scene=126&&sessionid=0

版权

来源：信息网络工程研究中心
本文共1000字，建议阅读5分钟本文带你了解GAN、DCGAN、WGAN、SRGAN。

GAN

生成网络接收一个随机噪声，生成逼真图像;

判别网络接收一个图像，生成该图像是真实的概率（0～1）;

GAN网络中存在两个不同的网络，训练方式采用的是对抗训练方式，其中G的梯度更新信息来自于判别器D，而不是来自数据样本。

GAN不适合处理离散形式的数据，比如文本。

使用JS散度作为距离公式

DCGAN

DCGAN（deep convolutional generative adversarial networks）采用深度卷积的生成对抗网络。

改进
1.取消Pooling层，改用加入stride的卷积代替。同时用卷积替代了全连接层。
2. 在D和G网络中均加入BN层。
3. G网络使用ReLU作为激活函数，最后一层使用tanh。
4. D网络中使用LeakyReLU作为激活函数
5. 使用adam优化器训练

WGAN

WGAN使用了新的距离定义 Wasserstein Distance（推土机距离），在理论上给出了GAN训练不稳定的原因，即交叉熵（JS散度）不适合衡量具有不相交部分的分布之间的距离，转而使用wassertein距离去衡量生成数据分布和真实数据分布之间的距离，理论上解决了训练不稳定的问题。

Wasserstein距离又叫Earth Mover's Distance(EMD，推土机距离)，参考：几个常用的计算两个概率分布之间距离的方法以及python实现

WGAN的提升

1. 解决了GAN训练不稳定的问题，不再需要小心平衡生成器和判别器的训练程度;
2. 几乎解决了mode collapse（模式崩溃）问题，保证生成样本的多样性;
3. 提供了具有意义的价值函数，可以分别判断判别器和生成器是否已经收敛。（原始GAN中如果D的效果不好，我们不知道是G生成的好，还是D判别的不好）

WGAN的改进