经典论文复现 | ICML 2017大热论文：Wasserstein GAN

最新推荐文章于 2024-07-27 20:40:25 发布

PaperWeekly

最新推荐文章于 2024-07-27 20:40:25 发布

阅读量1.9k

点赞数

本文链接：https://blog.csdn.net/c9yv2cf9i06k2a9e/article/details/83593519

版权

本文介绍了Wasserstein GAN（WGAN），它解决了原始GAN在训练中的梯度消失问题。WGAN利用Wasserstein距离作为优化目标，确保在分布没有重叠时仍能提供有意义的梯度。作者详细解析了WGAN的算法流程，并分享了模型复现的过程，证明了WGAN相比原始GAN的训练稳定性和生成质量的提升。

摘要由CSDN通过智能技术生成

640

过去几年发表于各大 AI 顶会论文提出的 400 多种算法中，公开算法代码的仅占 6%，其中三分之一的论文作者分享了测试数据，约 54% 的分享包含“伪代码”。这是今年 AAAI 会议上一个严峻的报告。人工智能这个蓬勃发展的领域正面临着实验重现的危机，就像实验重现问题过去十年来一直困扰着心理学、医学以及其他领域一样。最根本的问题是研究人员通常不共享他们的源代码。

可验证的知识是科学的基础，它事关理解。随着人工智能领域的发展，打破不可复现性将是必要的。为此，PaperWeekly 联手百度 PaddlePaddle 共同发起了本次论文有奖复现，我们希望和来自学界、工业界的研究者一起接力，为 AI 行业带来良性循环。

作者丨文永明

学校丨中山大学

研究方向丨计算机视觉，模式识别

最近笔者复现了 Wasserstein GAN，简称 WGAN。Wasserstein GAN 这篇论文来自 Martin Arjovsky 等人，发表于 2017 年 1 月。

640

论文作者用了两篇论文来阐述 Goodfellow 提出的原始 GAN 所存在的问题，第一篇是 WGAN 前作 Towards Principled Methods for Training Generative Adversarial Networks，从根本上分析 GAN 存在的问题。随后，作者又在 Wasserstein GAN 中引入了 Wasserstein 距离，提出改进的方向，并且给出了改进的算法实现流程。

原始GAN存在的问题

原始的 GAN 很难训练，训练过程通常是启发式的，需要精心设计的网络架构，不具有通用性，并且生成器和判别器的 loss 无法指示训练进程，还存在生成样本缺乏多样性等问题。

在 WGAN 前作中，论文作者分析出原始 GAN 两种形式各自存在的问题，其中一种形式等价于在最优判别器下，最小化生成分布与真实分布之间的 JS 散度。但是对于两个分布：真实分布 Pr 和生成分布 Pg，如果它们不重合，或者重合的部分可以忽略，则它们的 JS 距离 640 是常数，梯度下降时，会产生的梯度消失。