为什么 GAN 不好训练

木水_

已于 2023-12-18 10:06:01 修改

阅读量336

点赞数 1

分类专栏：深度学习文章标签：人工智能机器学习深度学习

于 2023-12-15 12:01:00 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_37324740/article/details/135012294

版权

深度学习专栏收录该内容

46 篇文章 8 订阅

订阅专栏

为什么 GAN 不好训练？先看 GAN 的损失：

当生成器固定时，堆D(x)求导，推理得到（加号右边先对log求导，再对负项求导）

然后在面对最优Discriminator时，Generator的优化目标就变成了：

上式可以变成：

也就是说，如果把Discriminator训练到极致，那么整个GAN的训练目标就成了最小化真实数据分布与合成数据分布之间的JS散度。。。

考虑如下二维空间中的两个分布P1和P2，P1在线段AB上均匀分布，P2在线段CD上均匀分布，通过控制参数θ可以控制着两个分布的距离远近。则：

此时，JS散度值为常数，无法传递梯度，梯度消失了。也就是说，如果Discriminator训练得太好，Generator就无法得到足够的梯度继续优化，而如果Discriminator训练得太弱，指示作用不显著，同样不能让Generator进行有效的学习。这样一来，Discriminator的训练火候就非常难把控，这就是GAN训练难的根源。

实际上，JS散度出现为常数的概率非常大，当数据分布类似高维空间中的低维流形，如下图时，虽然数据分布处理三维空间，本质展开是个二维平面。

除此之外， GAN 的训练过程中，生成器和判别器的loss无法指示进程，也就是说，我们无法通过生成器与判别器的loss来判断我们生成的图像是否到达了我们所满意的情况。只能通过显示训练图像自行感受训练程度。生成样本缺乏多样性。容易产生模型崩坏，即生成的图像中有着大量的重复图像。

参考博文：令人拍案叫绝的Wasserstein GAN - 知乎

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
为什么 GAN 不好训练

也就是说，如果Discriminator训练得太好，Generator就无法得到足够的梯度继续优化，而如果Discriminator训练得太弱，指示作用不显著，同样不能让Generator进行有效的学习。考虑如下二维空间中的两个分布P1和P2，P1在线段AB上均匀分布，P2在线段CD上均匀分布，通过控制参数θ可以控制着两个分布的距离远近。实际上，JS散度出现为常数的概率非常大，当数据分布类似高维空间中的低维流形，如下图时，虽然数据分布处理三维空间，本质展开是个二维平面。为什么 GAN 不好训练？
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。