wgan 不理解损失函数_GAN的优化（三）：对偶与WGAN

最新推荐文章于 2021-01-30 14:11:48 发布

赢小孽

最新推荐文章于 2021-01-30 14:11:48 发布

阅读量282

点赞数

文章标签： wgan 不理解损失函数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_28995139/article/details/112292753

版权

本文介绍了Wasserstein距离在解决GAN中度量连续性问题的作用，通过实例解释了Wasserstein距离的计算，并探讨了其在高维空间中的优势。此外，还引入了对偶问题的概念，以及WGAN的判别器损失函数，为后续的1-Lipschitz限制打下基础。

摘要由CSDN通过智能技术生成

本文首发于微信公众号：有三AI

作者：小米粥

说到对GAN的理解，我们不能简单停留在“生成器产生样本，判别器分辨样本真假”的阶段了，在经过第二篇文章后，对GAN的理解应该是：先学习一个关于生成器定义的隐式概率分布和训练数据集的本质概率分布之间的距离度量，然后优化生成器来缩减这个距离度量。今天的主要内容依旧围绕这个距离度量来展开。

1.度量连续性的问题

在第二篇文章的最后，我们简要讨论了f散度的问题。实际中，生成器定义的隐式概率分布和训练数据集的本质概率分布几乎不存在重叠部分，而且随着数据维度增加，这个趋势会更加严重，那么采样计算得来的f散度距离不仅不连续，而且几乎处处导数为0。

用一个非常简单的例子来解释一下，在二维空间有两个无任何重合的均匀分布，其中

我们来计算一下两个分布的KL散度，JS散度，总变差。

可以看出，当P和Q没有重合或者重合部分可忽略时，其f散度值为常数；当两者完全重合时，f散度值为0，即f散度无法为生成器提供可以减少损失函数的梯度信息，生成器无法训练获得优化方向。

对于此问题的一种解决方案是：通过对数据集中的样本和生成器生成的样本增加噪声，使得原本的两个低维概率分布“弥散”到整个高维空间，强行让它们产生不可忽略的重叠，此时的f散度便能“指示”出两个分布的距离。在训练过

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
wgan 不理解损失函数_GAN的优化（三）：对偶与WGAN

本文首发于微信公众号：有三AI作者：小米粥说到对GAN的理解，我们不能简单停留在“生成器产生样本，判别器分辨样本真假”的阶段了，在经过第二篇文章后，对GAN的理解应该是：先学习一个关于生成器定义的隐式概率分布和训练数据集的本质概率分布之间的距离度量，然后优化生成器来缩减这个距离度量。今天的主要内容依旧围绕这个距离度量来展开。1.度量连续性的问题在第二篇文章的最后，我们简要讨论了f散度的问题。实际中...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。