wgan 不理解损失函数_gan网络损失函数_从GAN到WGAN：生成对抗网络背后的数学原理（一）...

最新推荐文章于 2024-07-28 09:04:53 发布

weixin_39654823

最新推荐文章于 2024-07-28 09:04:53 发布

阅读量713

点赞数 1

文章标签： wgan 不理解损失函数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39654823/article/details/113549498

版权

本文深入探讨了生成对抗网络(GAN)的数学基础，包括KL散度和JS散度，以及它们在GAN训练中的作用。文章还介绍了GAN训练中的挑战，如纳什均衡、低维支持和模式崩溃，并详细阐述了Wasserstein GAN如何通过Wasserstein距离改进训练稳定性。

摘要由CSDN通过智能技术生成

作者：

Lilian Weng

编译：Bot

本文解释了生成对抗网络(GAN)背后的数学原理及其难以训练的原因，并指出Wasserstein GAN是通过测量两个概率分部之间的平滑度来改进GAN训练的。

如今，生成对抗网络(GAN)已经取得了不少大型成果，它可以复制真实世界的丰富内容，如图像、语言和音乐等。它受博弈论启发：两个模型，一个生成器，一个判别器，两者在相互竞争的同时又相互扶持、共同进步。但是训练GAN并不是一件容易的事，因为自Ian Goodfellow提出这个概念以来，它就一直存在训练不稳定、容易崩溃的问题。

在这里，我想介绍一下GAN背后的数学原理及其难以训练的原因，并引入2017年FAIR提出的Wasserstein GAN，谈谈它是怎么在数学上实现突破性改进的。

KL散度和JS散度

生成对抗网络(GAN)

D的最佳值

什么是全局最优

损失函数代表什么

GAN的问题

很难达成纳什均衡

低维支持

消失的渐变

模式崩溃

缺乏一个适当的评估指标

改进GAN的训练

Wasserstein GAN(WGAN)

什么是Wasserstein距离

为什么Wasserstein比JS、KL发散更好

把Wasserstein距离作为GAN的损失函数

示例：用GAN生成新的宠物小精灵(pokemon)

参考文献

KL散度和JS散度

在开始介绍GAN之前，我们先来回顾这两个描述概率分布差异的概念：KL散度和JS散度

最低0.47元/天解锁文章

weixin_39654823

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。