深度学习之生成对抗网络(6)GAN训练难题

深度学习之生成对抗网络(6)GAN训练难题


 尽管从理论层面分析了GAN网络能够学习到数据的真实分布,但是在工程实现中,常常出现GAN网络训练困难的问题,主要体现在GAN模型对超参数较为敏感,需要精心挑选能使模型工作的超参数设定,同时也容易出现模式崩塌现象。


1. 超参数敏感

 超参数敏感是指网络的结构设定、学习率、初始化状态等超参数对网络的训练过程影响较大,微量的超参数调整将可能导致网络的训练结果截然不同。如下图所示,图(a)为GAN模型良好训练得到的生成样本,图(b)中的网络由于没有采用Batch Normalization层等设置,导致GAN网络训练不稳定,无法收敛,生成的样本与真实样本差距非常大。

在这里插入图片描述

超参数敏感实例

2. 模式崩塌

模式崩塌(Model Collapse)是指模型生成的样本单一,多样性很差的现象。由于判别器只能鉴别单个样本是否采样自真是分布,并没有对样本多样性进行显式约束,导致生成模型可能倾向于生成真实分布的部分区间中的少量高质量样本,以此来在判别器中获得较高的概率值,而不会学习到全部的真是分布。模式崩塌现象在GAN中比较常见,如下图所示,在训练过程中,通过可视化生成样本可以观察到,生成的图片种类非常单一,生成网络总是倾向于生成某种单一风格的样本图片,以此骗过判别器。

在这里插入图片描述

图片生成模型崩塌


 另一个直观地理解模式崩塌的例子如下图所示,第一行为未出现模式崩塌现象的生成网络的训练过程,最后一列为真实分布,即2D高斯混合模型;第二行为出现模式崩塌现象的生成网络的训练过程,最后一列为真实分布。可以看到真实的分布由8个高斯模型混合而成,出现模式崩塌后,生成网络总是倾向于逼近真实分布的某个狭窄区间,如下图第2行前6列所示,从此区间采样的样本往往能够在判别器中较大概率判断为真实样本,从而骗过判别器。但是这种现象并不是我们希望看到的,我们希望生成网络能够逼近真实的分布,而不是真实分布中的某部分。

在这里插入图片描述

模型崩塌示意图


 那么怎么解决GAN训练的难题,让GAN可以像普通的神经网络一样训练较为稳定呢?WGAN模型给出了一种解决方案。

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值