Wasserstein GANs 三部曲（一）：Towards Principled Methods for Training Generative Adversarial Networks的理解

最新推荐文章于 2024-08-10 08:26:02 发布

大白兔兔92

最新推荐文章于 2024-08-10 08:26:02 发布

阅读量6.1k

点赞数 4

分类专栏： GAN系列笔记

本文链接：https://blog.csdn.net/xiaohouzi1992/article/details/80839921

版权

本文探讨了生成对抗网络(GANs)的训练问题，特别是KL散度和JS散度导致的优化挑战。文章通过数学推理和直观解释指出，当分布不重叠或重叠部分极小时，会导致训练不稳定和梯度消失。作者介绍了Wasserstein距离作为替代度量，以提高GAN的训练稳定性和避免样本单一化。

摘要由CSDN通过智能技术生成

论文地址：https://arxiv.org/abs/1701.04862

这一篇文章相当于一个引言，运用了许多推导与证明说明了生成对抗网路存在的一系列问题，然后引入了一个新的评价标准。虽然公式推导是比较乏味的，也可以参阅知乎上的这篇文章https://zhuanlan.zhihu.com/p/25071913，比较简单直观。当时我在学习的时候有部分也借鉴了这篇文章，以下是我的理解：

第一部分GAN 存在的问题：

1.GAN问题：难以训练，训练过程只能是启发式的，比如之前的DCGAN

2.GAN的生成模型和其它相比并没有太大不同，最主要的不同之处就是生成模型如何训练。

3.以前的生成模型训练依赖于极大似然估计或者KL散度。

K L散度定义：</