GAN万字长文综述

最新推荐文章于 2024-01-10 23:55:07 发布

小肥柴不是小废柴

最新推荐文章于 2024-01-10 23:55:07 发布

阅读量4.1k

点赞数 1

本文链接：https://blog.csdn.net/xs11222211/article/details/88083759

版权

本文全面介绍了生成对抗网络（GAN）的基础知识，包括GAN的基本概念、目标函数、模型结构、训练障碍及解决方案，以及与其他生成式模型的对比。文章深入探讨了GAN的隐空间理解，展示了GAN在图像生成、序列生成、半监督学习和域适应等领域的广泛应用，并列举了多个实例。最后，文章讨论了GAN的评价指标、与强化学习的关系、优缺点和未来研究方向。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

生成对抗网络（GAN，Generative Adversarial Networks）作为一种优秀的生成式模型，引爆了许多图像生成的有趣应用。GAN相比于其他生成式模型，有两大特点：

不依赖任何先验假设。传统的许多方法会假设数据服从某一分布，然后使用极大似然去估计数据分布。关于这点，我们后面还会讲到，没懂的同学先不用着急。
生成real-like样本的方式非常简单。GAN生成real-like样本的方式通过生成器(Generator)的前向传播，而传统方法的采样方式非常复杂，有兴趣的同学可以参考下周志华老师的《机器学习》一书中对各种采样方式的介绍。

这篇综述主要参考最新的一篇有关GAN综述的paper[1]，详细探讨了GAN的各种细节，以及改进，应用。本文对于论文内容做了一些调整以及补充，方便入门的同学阅读。目录如下(吐槽下简书竟然不支持markdown目录，csdn又广告太多，某乎markdown体验又差。要找一个好用的编辑器真是难！)：

文中许多内容大都根据自己所学总结，有不当之处欢迎指出。此外，本文参考了许多博客资料，已给出参考链接。如有侵权，请私信删除。

1. GAN的基本介绍

1.1 GAN的基本概念

GAN（Generative Adversarial Networks）从其名字可以看出，是一种生成式的，对抗网络。再具体一点，就是通过对抗的方式，去学习数据分布的生成式模型。所谓的对抗，指的是生成网络和判别网络的互相对抗。生成网络尽可能生成逼真样本，判别网络则尽可能去判别该样本是真实样本，还是生成的假样本。示意图如下：

GAN overview.png

隐变量（通常为服从高斯分布的随机噪声）通过Generator生成, 判别器负责判别输入的data是生成的样本还是真实样本。优化的目标函数如下：

对于判别器D来说，这是一个二分类问题，为二分类问题中常见的交叉熵损失。对于生成器G来说，为了尽可能欺骗D，所以需要最大化生成样本的判别概率，即最小化，一项与生成器G无关，可以忽略。

实际训练时，生成器和判别器采取交替训练，即先训练D，然后训练G，不断往复。值得注意的是，对于生成器，其最小化的是，即最小化的最大值。为了保证取得最大值，所以我们通常会训练迭代k次判别器，然后再迭代1次生成器（不过在实践当中发现，k通常取1即可）。当生成器G固定时，我们可以对求导，求出最优判别器:

把最优判别器代入上述目标函数，可以进一步求出在最优判别器下，生成器的目标函数等价于优化的JS散度(JSD, Jenson Shannon Divergence)。

可以证明，当G，D二者的capacity足够时，模型会收敛，二者将达到纳什均衡。此时，，判别器不论是对于还是中采样的样本，其预测概率均为，即生成样本与真实样本达到了难以区分的地步。