2、GAN Losses

最新推荐文章于 2022-08-12 10:20:03 发布

C--G

最新推荐文章于 2022-08-12 10:20:03 发布

阅读量99

点赞数

分类专栏： # 生成对抗网络文章标签：生成对抗网络计算机视觉人工智能

本文链接：https://blog.csdn.net/weixin_50973728/article/details/125774410

版权

生成对抗网络专栏收录该内容

5 篇文章 0 订阅

订阅专栏

EBGAN

Energy-based Generative Adversarial Networks

EBGAN的改变在discriminator上。把D看作是一个energy function，对real image赋予低能量，fake image赋予高能量。通过energy based思想可以把能量方面的很多工具拿来用

提出了一个pull-away term来防止Generator生成一样的图片，即mode collapse问题。所谓pull-away即“推开”，意思是不让生成的图片“扎堆”，也就是让生成的图片不一样
在这里插入图片描述
模型架构

主要改变在D里面。EBGAN把D变成了一个AutoEncoder，输出E为Encoder和Decoder的MSE（均方差）。即，为输入的图片，包括real和fake; 为L2-norm

Pull-away term的作用是解决mode collapse的问题。在这里首先提到了Salimans et al.,2016提出的“minibatch discriminator”，思想很简单，就是每次给D输入一个batch，而且D要检测整个batch而不是分别检测每张图片。Real image batch中每张图片是不一样的，而如果出现了mode collapse，即所有图片一样，则一定是假的，作者提出了pull-away term，简称EBGAN-PT
在这里插入图片描述
思想很简单，这一项是，生成的fake image batch中每张图片经过Encoder编码后产生一个向量，两两向量算cosine距离，然后求和取平均。让这一项尽量小，则两两向量越接近正交。注意这一项仅仅用于假图片训练，因为它毕竟是为了解决G的mode collapse问题，若用于真图片就不讲理了。还要注意一点是，EBGAN-PT也有权重，作者在实验中取了0.1

BEGAN

BEGAN是Google在17年上半年出的一篇论文，此论文对GAN做了进一步的改进，提出了一种新的评价生成器生成质量的方式，使GAN即使使用很简单的网络，不加一些训练trick比如BN,minibatch,使用SELU激活函数等等，也能实现很好的训练效果，完全不用担心模式崩溃（model collapse）和训练不平衡的问题。

以往的GAN以及其变种都是希望生成器生成的数据分布尽可能的接近真实数据的分布，当生成数据分布等同于真实数据分布时，我们就确定生成器G经过训练可以生成和真实数据分布相同的样本，即获得了生成足以以假乱真数据的能力，所以从这一点出发，研究者们设计了各种损失函数去令G的生成数据分布尽可能接近真实数据分布。

直观来讲，如果两个分布越相近，我们可以认为他们越相似，当生成数据分布非常接近于真实数据分布的时候，这时候生成器就有足够的生成能力。其中比较好的改进成果主要有DCGAN、WGAN、WGAN-GP等等。 BEGAN代替了这种估计概率分布方法，它不直接去估计生成分布Pg与真实分布Px的差距，而是估计分布的误差的分布之间的差距，作者认为只要分布之间的误差分布相近的话，也可以认为这些分布是相近的
在这里插入图片描述

网络结构

在这里插入图片描述

损失函数
在这里插入图片描述
为了估计分布的误差，作者使用了auto-encoder作为D，D的输入是图像V，维度为RNx，输出的也是维度为RNx的图片，本文中n=1,自编码器的模型如下

此处的L(v)是一个pixel-wise的损失，表示真实输入图像v和经过自编码网络D输出的D(v)的相似程度，L越小，说明v, D(v)越相似。
同样的，我们可以得到 L’(v)=|v-G(v)|n 这样一个pixl-wise误差。

此时重点来了，由于两者都是pixel-wise的，那么L里的数值一定满足某种分布，在有足够大的像素的情况下，假设像素是满足IID即独立同分布条件，根据中心极限定理，像素的误差近似满足正太分布，那就是说L(v)和L’(v)分别是µ1 = N(m1; C1)和 µ2 = N(m2; C2)的正太分布，m为均值，维度为Rp，c为方差维度为Rp×p 。

那么根据wassertein公式，两个正太分布µ1、µ2的距离为

在这里插入图片描述
trace是求迹操作，P=1时，简化为如下形式