GAN有不少未解决的问题:1、虽然在DCGAN和improveGAN中提出了不少训练GAN的tricks,但是GAN还是很难训练。2、很难控制G网络的多样性。3、D网络和G网络之间的平衡性很难控制,大部分情况下D网络在训练之初能力会更强。
而BEGAN提出了能够使得训练过程快又稳定的方法;解决了D网络和G网络能力平衡问题;有能力控制生成图片的多样性和质量平衡问题以及衡量收敛性的近似方法。
BEGAN
上图是BEGAN在mnist数据上设计的一个模型,借助了EBGAN的encoder-decoder作为D网络结构的思想。一共有三个网络,分别是G网络,以及D网络中的encoder和decoder。其中G网络和decoder的网络结构是一样的,这两个网络旁边灰色部分是可选的优化结构(跳跃连接和加入h0信息)。
看完模型结构例子,我们在看看began的损失函数:
其中 L 表示重构误差:
(x)=L1_loss(采样而来的真实图片y−y经过D网络重构出来的图片) L ( x ) = L 1 _ l o s s ( 采 样 而 来 的 真 实 图 片 y − y 经 过 D 网 络 重 构 出 来 的 图 片 )
(G(zG)