尽管从理论层面分析了GAN网络能够学习到数据的真实分布,但是在工程实现中,常常出现GAN网络训练困难的问题,主要体现在GAN模型对超参数较为敏感,需要精心挑选能使模型工作的超参数设定,同时也容易出现模式崩塌现象。
1. 超参数敏感
超参数敏感是指网络的结构设定、学习率、初始化状态等超参数对网络的训练过程影响较大,微量的超参数调整将可能导致网络的训练结果截然不同。如下图所示,图(a)为GAN模型良好训练得到的生成样本,图(b)中的网络由于没有采用Batch Normalization层等设置,导致GAN网络训练不稳定,无法收敛,生成的样本与真实样本差距非常大。
2. 模式崩塌
模式崩塌(Model Collapse)是指模型生成的样本单一,多样性很差的现象。由于判别器只能鉴别单个样本是否采样自真是分布,并没有对样本多样性进行显式约束,导致生成模型可能倾向于生成真实分布的部分区间中的少量高质量样本,以此来在判别器中获得较高的概率值,而不会学习到全部的真是分布。模式崩塌现象在GAN中比较常见,如下图所示,在训练过程中,通过可视化生成样本可以观察到,生成的图片种类非常单一,生成网络总是倾向于生成某种单一风格的样本图片,以此骗过判别器。
另一个直观地理解模式崩塌的例子如下图所示,第一行为未出现模式崩塌现象的生成网络的训练过程,最后一列为真实分布,即2D高斯混合模型;第二行为出现模式崩塌现象的生成网络的训练过程,最后一列为真实分布。可以看到真实的分布由8个高斯模型混合而成,出现模式崩塌后,生成网络总是倾向于逼近真实分布的某个狭窄区间,如下图第2行前6列所示,从此区间采样的样本往往能够在判别器中较大概率判断为真实样本,从而骗过判别器。但是这种现象并不是我们希望看到的,我们希望生成网络能够逼近真实的分布,而不是真实分布中的某部分。
那么怎么解决GAN训练的难题,让GAN可以像普通的神经网络一样训练较为稳定呢?WGAN模型给出了一种解决方案。