GAN网络的模型坍塌和不稳定的分析

最新推荐文章于 2025-04-11 09:28:49 发布

xinxiang7

最新推荐文章于 2025-04-11 09:28:49 发布

阅读量7.8k

点赞数 8

分类专栏： GAN 文章标签：深度学习 GAN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xinxiang7/article/details/107182825

版权

GAN 专栏收录该内容

3 篇文章

订阅专栏

本文深入探讨了生成对抗网络(GAN)的两大难题：模式坍塌和训练不稳定，解析了其背后的数学原理，包括KL和JS散度的作用，以及Wasserstein GAN如何解决梯度消失问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

众所周知，GAN异常强大，同时也非常难以训练。主要有以下亮点原因：

模型坍塌(mode collapse)
难以收敛和训练不稳定(convergence and instability)
GAN网络的一般表达式可以表示为：
利用minmax获得公式¹

给定G，求D的最优化²

针对D进行求导：

获取最优解：

最优解结果：

KL和JS散度表达式：

GAN表达式：

增加一项，表示生成网络G的损失函数：

简化：

结合公式(6)和公式(8)可以得出：

公式(12)中的KL散度使得两个分布尽可能的小，而JS的负号使得两个分布近可能的大。
两种情况：

第一种情况，生成了不真实的样本，惩罚很大；第二种情况，未能产生真实的样本，惩罚很小。第一种生成的样本不准确，第二种生成的样本不够多样。基于这个原理，G 倾向于生成重复但是安全的样本，而不愿意冒险生成不同但不安全的样本，这会导致模式坍塌（mode collapse）问题。
当然很有可能出现两个分布不相关的情况³，这种情况就会导致称为一个常数，也就出现了梯度消失的情况。所以判别器训练得太好，生成器梯度消失，生成器loss降不下去；判别器训练得不好，生成器梯度不准，四处乱跑。只有判别器训练得不好不坏才行，但是这个火候又很难把握。
对于另外一种G网络的表现形式，可以总结为：D表现越好，G的梯度消失越严重。

Generative Adversarial Networks (GANs): Challenges, Solutions, and Future Directions ↩︎
A Review on Generative Adversarial Networks: Algorithms, Theory, and Applications ↩︎
令人拍案叫绝的Wasserstein GAN/https://zhuanlan.zhihu.com/p/25071913 ↩︎

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。