GAN模型调参

最新推荐文章于 2024-06-21 13:54:59 发布

洛克-李

最新推荐文章于 2024-06-21 13:54:59 发布

阅读量4.2k

点赞数

分类专栏：深度学习文章标签：深度学习机器学习计算机视觉 GAN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_30232405/article/details/122978353

版权

深度学习专栏收录该内容

28 篇文章 1 订阅

订阅专栏

文章目录

1.软标签和noise标签
2.调整交叉训练
3.修改损失函数
- 3.1 WGAN
- 3.2 WGAN-GP
4.考虑数据标签任务（分类任务）
5.梯度查看

GAN在提出之后，一直很火。但是其存在诸多的难点，首先难以平衡G（生成器）和D（判别器）之间的训练，同时容易造成模型坍塌。因此在训练GAN时会很难。

1.软标签和noise标签

这一点在训练判别器时极为重要。使用硬标签（非 1 即 0）几乎会在早期就摧毁所有的学习进程，导致判别器的损失迅速趋近于 0。可以采用一个 0-0.1 之间的随机数来代表「标签 0」（真实数据），并使用一个 0.9-1 之间的随机数来代表「标签 1」（生成数据）。在训练生成器时则不用这样做。

此外，添加一些带噪声的标签是有所帮助的。将输入给判别器的图像中的 5% 的标签随机进行了反转，即真实数据被标记为生成数据、生成数据被标记为真实数据。

2.调整交叉训练

每训练一次判别器，训练K次生成器；这样可以充分让生成器在前期进行学习。

3.修改损失函数

在GAN论文里用min (log 1-D)优化生成器，实际上max（log D）更好
实际代码中用反转标签来训练G更方便，即把生成数据当成real的标签来训练
现在有很多针对损失函数进行修改的模型：

3.1 WGAN

使用了Wasserstein损失，去掉了判别器最后一层的sigmoid和log，直接优化Wasserstein距离，但是WGAN需要对判别器做Weight Clip，比较麻烦，而且不能用动量优化（包括momentum和Adam），通常使用RMSProp来优化WGAN

3.2 WGAN-GP

改进了WGAN中的weight clip（权重截断），基于梯度惩罚的loss替代WGAN中的Weight Clip，从而产生比WGAN更高质量的样本，这个loss是可以用Adam来优化的。

4.考虑数据标签任务（分类任务）

ACGAN

如上图所示，ACGAN相对于GAN不同点在于：

（1）GAN只有Z即噪声作为输入变量，ACGAN多了一个分类变量

（2）GAN输出只有判定数据真假判断，而ACGAN除了真假外增加了类别判断

5.梯度查看

在模型训练时，需要通过梯度来观察整个模型是否有学习到，可以通过其梯度进行观察

（1）判别器顶层梯度
在这里插入图片描述

（2）生成器顶层梯度
在这里插入图片描述

判别器一开始就接受了高梯度更新，导致判别器一开始的判别能力已经很强了；而生成器一开始的只接受较少的梯度用于更新参数，导致生成器效果较差。

利用上面的方法修改过后，生成器一开始可以接受大的梯度进行更新，同时梯度分布来看更加集中。
在这里插入图片描述

关注

0
点赞
踩
24

收藏

觉得还不错? 一键收藏
打赏
6
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

洛克-李 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。