深度学习之生成对抗网络（6）GAN训练难题

最新推荐文章于 2024-05-22 22:47:23 发布

炎武丶航

最新推荐文章于 2024-05-22 22:47:23 发布

阅读量2.2k

点赞数 2

分类专栏： TensorFlow2 深度学习文章标签：深度学习神经网络 tensorflow

本文链接：https://blog.csdn.net/weixin_43360025/article/details/120743235

版权

深度学习同时被 2 个专栏收录

125 篇文章 54 订阅

订阅专栏

TensorFlow2

69 篇文章 12 订阅

订阅专栏

深度学习之生成对抗网络（6）GAN训练难题

1. 超参数敏感
2. 模式崩塌

尽管从理论层面分析了GAN网络能够学习到数据的真实分布，但是在工程实现中，常常出现GAN网络训练困难的问题，主要体现在GAN模型对超参数较为敏感，需要精心挑选能使模型工作的超参数设定，同时也容易出现模式崩塌现象。

1. 超参数敏感

超参数敏感是指网络的结构设定、学习率、初始化状态等超参数对网络的训练过程影响较大，微量的超参数调整将可能导致网络的训练结果截然不同。如下图所示，图（a）为GAN模型良好训练得到的生成样本，图（b）中的网络由于没有采用Batch Normalization层等设置，导致GAN网络训练不稳定，无法收敛，生成的样本与真实样本差距非常大。

在这里插入图片描述

超参数敏感实例

2. 模式崩塌

模式崩塌（Model Collapse）是指模型生成的样本单一，多样性很差的现象。由于判别器只能鉴别单个样本是否采样自真是分布，并没有对样本多样性进行显式约束，导致生成模型可能倾向于生成真实分布的部分区间中的少量高质量样本，以此来在判别器中获得较高的概率值，而不会学习到全部的真是分布。模式崩塌现象在GAN中比较常见，如下图所示，在训练过程中，通过可视化生成样本可以观察到，生成的图片种类非常单一，生成网络总是倾向于生成某种单一风格的样本图片，以此骗过判别器。

在这里插入图片描述

图片生成模型崩塌

另一个直观地理解模式崩塌的例子如下图所示，第一行为未出现模式崩塌现象的生成网络的训练过程，最后一列为真实分布，即2D高斯混合模型；第二行为出现模式崩塌现象的生成网络的训练过程，最后一列为真实分布。可以看到真实的分布由8个高斯模型混合而成，出现模式崩塌后，生成网络总是倾向于逼近真实分布的某个狭窄区间，如下图第2行前6列所示，从此区间采样的样本往往能够在判别器中较大概率判断为真实样本，从而骗过判别器。但是这种现象并不是我们希望看到的，我们希望生成网络能够逼近真实的分布，而不是真实分布中的某部分。

在这里插入图片描述

模型崩塌示意图

那么怎么解决GAN训练的难题，让GAN可以像普通的神经网络一样训练较为稳定呢？WGAN模型给出了一种解决方案。

炎武丶航

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
深度学习之生成对抗网络（6）GAN训练难题

深度学习之生成对抗网络（6）GAN训练难题1. 超参数敏感2. 模式崩塌尽管从理论层面分析了GAN网络能够学习到数据的真实分布，但是在工程实现中，常常出现GAN网络训练困难的问题，主要体现在GAN模型对超参数较为敏感，需要精心挑选能使模型工作的超参数设定，同时也容易出现模式崩塌现象。1. 超参数敏感超参数敏感是指网络的结构设定、学习率、初始化状态等超参数对网络的训练过程影响较大，微量的超参数调整将可能导致网络的训练结果截然不同。如下图所示，图（a）为GAN模型良好训练得到的生成样本，图（b）中的
复制链接

扫一扫