GAN小结（BEGAN EBGAN WGAN CycleGAN conditional GAN DCGAN PGGAN VAEGAN）

最新推荐文章于 2024-01-30 11:43:19 发布

俭任G

最新推荐文章于 2024-01-30 11:43:19 发布

阅读量2k

点赞数 2

本文链接：https://blog.csdn.net/weixin_41798111/article/details/89328915

版权

断断续续看了生成对抗网络一些日子，下面把我比较感兴趣也算是我认为效果比较好的GAN进行简单梳理，其中会参考众多前辈的文章，主要包括

1.EBGAN

原文 https://arxiv.org/pdf/1609.03126.pdf

2.BEGAN

原文：https://arxiv.org/abs/1703.10717

代码：https://github.com/carpedm20/BEGAN-tensorflow

https://github.com/Heumi/BEGAN-tensorflow

https://github.com/carpedm20/BEGAN-pytorch

3.WGAN

原文：https://arxiv.org/abs/1701.07875

代码：https://github.com/hwalsuklee/tensorflow-generative-model-collections

https://github.com/Zardinality/WGAN-tensorflow

4.WGAN-GP

原文：https://arxiv.org/abs/1704.00028

代码：https://link.zhihu.com/?target=https%3A//github.com/igul222/improved_wgan_training

https://github.com/caogang/wgan-gp

CycleGAN

conditional GAN

DCGAN

PGGAN

VAEGAN

原文：http://proceedings.mlr.press/v48/larsen16.pdf

1.EBGAN

energy-based基于能量的生成对抗网络

将判别器看成能量函数，不再判别判别器输入图像是否来自Pdata还是Pg，而是去鉴别输入图像的重构性高不高。具体来说就是，本来discriminator的目的是学会寻找Pdata与Pg之间的差异,进而给图片质量打分，现在我们不再是通过寻找差异来打分，而是用一种”强烈的记忆”让discriminator仅仅记住Pdata长什么样子，将real image经过自编码器的输入给低能量（0），将生成（假的）样本给高能量（有上限）。EBGAN就是用autoencoder实现了这样的“记忆”，我们会在接下来详细介绍。

这个结构的优点是，可以提前训练Auto-Encoder，让判别器变得很强，而不是随着生成器逐渐变好来逐渐提升判别器的能力

D是一个自编码器auto-encoder

损失函数：

$f_{D}(x,z)=\left \|Dencoder(Encoder(x)) -x \right \|+[m-\left \| Dencoder(Encoder(G(z)))-G(z) \right \|]^{+}$

$f_{G}(x,z)=\left \|Dencoder(G(z)) \right \|=\left \| Dencoder(Encoder(G(z)))-G(z) \right \|]$

其中：

训练数据x图像,

Dencoder对x编码解码后的图像是Dencoder(x)

Dencoder(G（z）)是Dencoder以G的生成为输入的结果（对应上图是上一种输入）

[ ]+是max(0,*)

$\left \|Dencoder(Encoder(x)) -x \right \|-\left \| Dencoder(Encoder(G(z)))-G(z) \right \|$ 趋向于0，则得到图像x经过Encoder和decoder得到的图像D(E(x))与x越接近越好，即减小了real image重构损失，并得到由随机变量z经过生成器G生成的图像G(z)（fake image）经过Encoder-decoder之间差距越接近m越好，m是一个参数，重构损失大于m为0，小于m为正就是去掉m，只剩重构损失，添加m是不想让fake image非常negative，所以给定一个参数m，这样就可以把real image和G(z)区分开

2.BEGAN

网络结构和EBGAN相似，应该是相同

损失函数差别在 $k_{t}$ 和 $\gamma$

针对EBGAN存在问题：

当D_loss=0时，有可能是 $\left \|Dencoder(Encoder(x)) -x \right \|=\left \| Dencoder(Encoder(G(z)))-G(z) \right \|$ ，而不是理想中的 Dencoder(Encoder(x)) =x 和 Dencoder(Encoder(G(z)))=G(z) ，这样就会很麻烦