【生成对抗网络】Conditional GAN (CGAN，条件GAN) 详细解读

最新推荐文章于 2025-04-06 14:17:02 发布

__阿健__

最新推荐文章于 2025-04-06 14:17:02 发布

阅读量3.3w

点赞数 22

分类专栏：生成对抗网络 GAN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_24224067/article/details/104293409

版权

生成对抗网络 GAN 专栏收录该内容

5 篇文章

订阅专栏

对应论文：《Conditional Generative Adversarial Nets》

Conditional GAN (CGAN，条件GAN)，是 Mehdi Mirza 于2014年11月份发表的一篇文章，也是 GAN 系列的早期经典模型之一，是目前许多GAN应用的前身。

文章的想法是希望 可以控制 GAN 生成的图片，而不是单纯的随机生成图片。具体地，Conditional GAN 在生成器和判别器的输入中增加了额外的条件信息，生成器生成的图片只有足够真实且与条件相符，才能够通过判别器。

【参考解读】

[1] 对抗生成网络学习（十三）——conditionalGAN生成自己想要的手写数字(tensorflow实现)

[2] 李弘毅老师GAN笔记（二），Conditional GAN

[3] 李宏毅 2018最新GAN课程 class 2 Conditional Generation by GAN

一、论文解读

原始的 GAN 模型没有任何条件限制，生成图像是随机的。因此作者考虑 加入一些条件信息，比如类别标签或者是其他类型的数据，使得 图像生成能够朝规定的方向进行。

举个例子，比如输入一只狗在奔跑，输出即为一只狗在奔跑的图。
在这里插入图片描述

方法思路

Conditional GAN 的原论文比较短，主要是想法的阐述，对于具体的实现方式并没有做太多限定。

网络模型

为了实现条件GAN的目的，生成网络和判别网络的原理和训练方式均要有所改变。

模型部分，在判别器和生成器中都添加了额外信息 y，y 可以是类别标签或者是其他类型的数据，可以将 y 作为一个额外的输入层丢入判别器和生成器。

在生成器中，作者将输入噪声 z 和 y 连在一起隐含表示，而对抗性训练框架在如何构成这种隐藏表示上具有相当大的灵活性。（需要注意的是，Conditional GAN中并没有用到卷积操作，所以这么操作是没有任何问题的。）
在这里插入图片描述

损失函数

二人极大极小博弈的目标函数为：
在这里插入图片描述

MNIST实验

在该实验中，作者使用MNIST的类别标签的one-hot编码作为条件信息y。具体的网络模型可以参考原文。

作者在MNIST数据集上的实验效果：
在这里插入图片描述

二、Conditional GAN的延伸

Conditional GAN的想法在各方面的细节上，比如条件y的具体内容（类别标签、实际的图片…），生成器、判别器中条件y的表示方式，判别器的打分方式（真实度和条件符合度放在一起打还是分开来打）等，有各种实现形式，因而延伸出了丰富的应用。

在这里插入图片描述

（1）text-to-image（文本生成图像）

在这里插入图片描述

（2）image-to-image（图像转换）

在这里插入图片描述

（3）Speech Enhancement（语音增强）

在这里插入图片描述

（4）Video Generation（视频生成）

在这里插入图片描述

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。