wgan 不理解损失函数_【GAN-8】WGAN-Gradient Penalty

最新推荐文章于 2023-06-11 15:59:21 发布

一颗橙子君

最新推荐文章于 2023-06-11 15:59:21 发布

阅读量1.5k

点赞数

文章标签： wgan 不理解损失函数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42517607/article/details/112292749

版权

论文

Improved Training of Wasserstein GANsxxx.itp.ac.cn

我们之前说了，WGAN的（启发式的）保证函数

的方法是让

的参数

满足

这一看就是很扯淡的方法，这篇文章则是对这个的改进。

先说说有什么问题。在GAN-GP这篇论文中，作者给出了WGAN的两个主要缺点，同时用了一个toy example说明这些问题。

作者发现不仅是原文中的直接对

clip，同时，对

的L2 norm clip，soft的约束

的L1，L2 norm，等等，都有这些问题。

总之一句话，直接对

下手就是不行。

Capacity underuse

这是容易理解的，毕竟你把

约束在了一个很小的范围内，模型的容量自然很难得到保证。

作者们的toy example的大致思想是，把

和

都定下来，其中就是

在

的基础之上加一些噪声。

分别是8个Gaussians，25个Gaussians和Swiss Roll数据集，总之就是三个确定的分布。

上图中的第一排是WGAN中critic（其实就是discriminator，他们换了个名字）的值的图像，下图的则是WGAN-GP的，很容易看出WGAN的模型复杂度确实有影响，WGAN-PG要看起来好得多。

Exploding and vanishing gradients

这同样是直接对

约束带来的后果，作者尝试了WGAN不同的clip画出来的梯度的norm。

注意，随着层数越靠近输入层，norm的波动应该越大，毕竟梯度是反着来的。

上图说明了WGAN的梯度不是爆炸就是消失。

当然在GAN中一般都使用了batch normalization的技术，梯度的波动不会这么剧烈，但是WGAN的性能可能会受到影响。

当然，原始的WGAN还有一个缺点，就是实际上根本不能保证clip的函数

是1-Lipschitz的

，那WGAN的W就无从谈起了。

作者的意思是，既然我们想让

满足1-Lipschitz，而1-Lipschitz可以看作

梯度处处小于1，那么我们为何不直接加这个约束呢？

于是他们提出了Gradient penalty，这就是算法名字中GP的由来。

于是，现在的损失函数形如

显然那个Our gradient penalty比较有说道，下面的是对这个公式的具体说明。

Sampling distribution

是什么呢？

我们当然希望

是整个空间的均匀分布，这样能保证

处处都是1-Lipschitz的，但是这实际上是不现实的。而我们实际上也只要保证

和

之间的点

满足这个性质就可以了。

因此我们从

采样一个点，再从

采样一个点，这样形成了一条

线段，然后从这个线段上采样。

Penalty coefficient

这是个超参数，经验上取

就好了。

No critic batch normalization

这个也显然，用了batch normalization还咋Gradient penalty嘛。

Two-sided penalty

这个比较重要，既然我们希望梯度处处小于1，为什么不做单边约束，也就是

这是因为实际上，EM距离表示为

而函数

的要求虽然是对任意

但是往往是取等号的，毕竟要求极值

嘛。

因此这里就启发式的写成Two-sided penalty而不是One-sided penalty了。

当然这只是经验上的改进。

算法长这样

和WGAN的一个小区别是WGAN-GP用了adam做优化，而WGAN用的是RMSprop，不过这是细节啦。

一颗橙子君

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
wgan 不理解损失函数_【GAN-8】WGAN-Gradient Penalty

论文Improved Training of Wasserstein GANsxxx.itp.ac.cn我们之前说了，WGAN的（启发式的）保证函数的方法是让的参数满足这一看就是很扯淡的方法，这篇文章则是对这个的改进。先说说有什么问题。在GAN-GP这篇论文中，作者给出了WGAN的两个主要缺点，同时用了一个toy example说明这些问题。作者发现不仅是原文中的直接对 clip，...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。