GAN不好训练的原因:只要两个分布没有重合部分,loss都一样,也就没有办法一步一步去接近真实分布
如果最后的判别器是一个sigmoid的二分类网络,并且已经训练好了,由于sigmoid两边的梯度很小,所以生成器就没有办法得到有效的学习。LSGAN(Least Square GAN)来解决这个问题
由于JS散度会有不好训练的情况,而且fGAN中指出可以用不同的散度来度量两个分布之间的差异,WGAN(Wasserstein GAN)采用的是Earth Mover’s Distence 来衡量两个分布之间的差异
Earth Mover’s Distence的实际计算方法
原始的WGAN让判别器平滑的操作方法:
改进以后的方法:improved WGAN(WGAN-GP)
从原始GAN到WGAN: