GAN及其变体CGAN、WGAN

最新推荐文章于 2024-06-21 01:41:49 发布

青青大肥羊

最新推荐文章于 2024-06-21 01:41:49 发布

阅读量3.1k

点赞数 2

分类专栏： deep learning

本文链接：https://blog.csdn.net/qq_31425127/article/details/80348873

版权

本文详细介绍了生成式对抗网络（GAN）、条件生成式对抗网络（CGAN）、 Wasserstein GAN（WGAN）以及Wasserstein GAN with Gradient Penalty（WGAN-GP）。内容涵盖了各个模型的基本原理、优化过程以及它们之间的区别，旨在揭示这些技术在无监督和有监督学习中的应用和改进。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

生成式对抗网络GAN(无监督)

GAN由Goodfellow在2014年提出，启发自博弈论中的二人零和博弈。由一个生成模型G和一个判别模型D组成。生成模型捕捉样本数据的分布，判别模型是一个二分类器，判别输入的数据是真实数据还是生成的数据。G和D一般都是非线性映射函数，例如多层感知器、卷积神经网络等。

生成模型输入的是一个服从某一简单分布（高斯分布）的噪声变量z，输出的是与训练图像相同尺寸的伪图像；
判别模型输入的是真实图像和伪图像，输出的是一个置信度（概率值0-1），表示判别输入中伪图像是真实图像的概率
对于生成模型G来说要尽可能的欺骗D，使D输出高概率（误判为真实样本）；对D来说要尽可能输出低概率，从而形成对抗。

GAN的优化过程是一个“二元极小极大博弈”问题：
GAN
作者后来又提出一个改进版本，即: log D(x)-log(D(G(z)))

固定模型G，训练网络D使得最大概率的分对训练样本的标签，即最大化 log D(x)+log(1-D(G(z)))
固定网络D，训练网络G使得最小化 log(1-D(G(z)))，即最大化D的损失
D和G同时训练，训练时固定一方，更新另一方的网络参数，交替迭代，使得对方的错误最大化，最终，G能估计出样本数据的分布。