GAN的训练心得技巧（汇总）

最新推荐文章于 2024-04-06 12:41:36 发布

qxq_sunshine

最新推荐文章于 2024-04-06 12:41:36 发布

阅读量4.5k

点赞数 2

分类专栏：深度学习理解篇

原文链接：https://www.jianshu.com/p/aab68eb0f7ed

版权

深度学习理解篇专栏收录该内容

38 篇文章 7 订阅

订阅专栏

训练WGAN的时候，有几个方面可以调参：

a. 调节Generator loss中GAN loss的权重。 G loss和Gan loss在一个尺度上或者G loss比Gan loss大一个尺度。但是千万不能让Gan loss占主导地位, 这样整个网络权重会被带偏。

b. 调节Generator和Discrimnator的训练次数比。一般来说，Discrimnator要训练的比Genenrator多。比如训练五次Discrimnator，再训练一次Genenrator(WGAN论文是这么干的)。

c. 调节learning rate，这个学习速率不能过大。一般要比Genenrator的速率小一点。

d. Optimizer的选择不能用基于动量法的，如Adam和momentum。可使用RMSProp或者SGD。

e. Discrimnator的结构可以改变。如果用WGAN，判别器的最后一层需要去掉sigmoid。但是用原始的GAN，需要用sigmoid，因为其loss function里面需要取log，所以值必须在[0,1]。这里用的是邓炜的critic模型当作判别器。之前twitter的论文里面的判别器即使去掉了sigmoid也不好训练。

f. Generator loss的误差曲线走向。因为Generator的loss定义为：

G_loss = -tf.reduce_mean(D_fake)

Generator_loss = gen_loss + lamda*G_loss

其中gen_loss为Generator的loss，G_loss为Discrimnator的loss，目标是使Generator_loss不断变小。所以理想的Generator loss的误差曲线应该是不断往0靠的下降的抛物线。

g. Discrimnator loss的误差曲线走向。因为Discrimnator的loss定义为：

D_loss = tf.reduce_mean(D_real) - tf.reduce_mean(D_fake)

这个是一个和Generator抗衡的loss。目标就是使判别器分不清哪个是生成器的输出哪个是真实的label。所以理想的Discrimnator loss的误差曲线应该是最终在0附近振荡，即傻傻分不清。换言之，就是判别器有50%的概率判断你是真的，50%概率判断你是假的。

h. 之前的想法是就算判别器不训练，那么它判断这个图片是真是假的概率都是50%，那D_loss = tf.reduce_mean(D_real) - tf.reduce_mean(D_fake)不就已经在0附近了吗？

其实不是这样的。如果是wgan的话，判别器的输出是一个负无穷到正无穷的数值，那么要让它对两个不同的输入产生相似的输出是很难的。同理，对于gan的话，判别器的输出是介于[0,1]之间的，产生两个相似的输出也是很困难的。如果判别器的输出是0或者1的话，那就是上面说的情况。所以，网络要经过学习，使得输出尽可能相似，那就达到了傻傻分不清的状态了。

另外几篇：

1、GAN训练心得 https://blog.csdn.net/q1242027878/article/details/84452902

2、ICCV 2017：训练GAN的16个技巧，2400+星（PPT）

https://blog.csdn.net/amds123/article/details/78388247

3、