生成对抗网络的发展与应用

一、生成对抗网络的提出

Generative Adversarial Nets

Ian J. Goodfellow等人于2014年提出生成对抗网络(GAN),生成对抗网络是一种无监督的深度学习模型,通过框架内的生成器(Generative Model)和判别器(Discriminator Model)的相互博弈产生相当好的输出。在博弈过程中,生成器根据某个随机噪声 z z z 产生一个近似真实数据的生成数据,判别器再对真实数据和生成数据进行判别。在优化过程中,生成器要求自己生成的数据能够“欺骗”判别器,而判别器要求自己能够准确识别真实数据和生成数据。生成器和判别器的优化目标如下:

L G A N = V ( D , G ) = E x ∼ p d a t a ( x ) [ l o g ( D ( x ) ) ] + E z ∼ p z ( z ) [ l o g ( 1 − D ( G ( z ) ) ) ] \mathcal{L}_{GAN} = V(D,G) = \mathbb{E}_{x \sim p_{data}(x)}[log(D(x))] + \mathbb{E}_{z \sim p_{z}(z)}[log(1-D(G(z)))] LGAN=V(D,G)=Expdata(x)[log(D(x))]+Ezpz(z)[log(1D(G(z)))]

上式中的 L G A N \mathcal{L}_{GAN} LGAN 中包含了两个损失函数: E x ∼ p d a t a ( x ) [ l o g ( D ( x ) ) ] \mathbb{E}_{x \sim p_{data}(x)}[log(D(x))] Expdata(x)[log(D(x))] 用于判别器, E z ∼ p z ( z ) [ l o g ( 1 − D ( G ( z ) ) ) ] \mathbb{E}_{z \sim p_{z}(z)}[log(1-D(G(z)))] Ezpz(z)[log(1D(G(z)))] 用于生成器,训练中也有两个优化器分别对应了不同的网络;

生成对抗网络的架构图如下:
1.1 GAN 结构

二、生成对抗网络的发展

Conditional Generative Adversarial Nets

尽管 GAN 借助了生成器和判别器之间的博弈达到了一个良好的效果,但是它的输入是随机噪声 z z z,输出则是与该噪声有关的随机数据,为了使得该 GAN 的生成过程可控,M. Mirza 等人在2014提出了 Conditional GAN(CGAN),在生成器和判别器上都加入了标签数据,那么我们就可以通过标签数据来保证输出的图像的标签,优化目标如下:

L C G A N = E x ∼ p d a t a ( x ) [ l o g ( D ( x ∣ c ) ) ] + E z ∼ p z ( z ) [ l o g ( 1 − D ( G ( z ∣ c ) ) ) ] \mathcal{L}_{CGAN} = \mathbb{E}_{x \sim p_{data}(x)}[log(D(x|c))] + \mathbb{E}_{z \sim p_{z}(z)}[log(1-D(G(z|c)))] LCGAN=Expdata(x)[log(D(xc))]+Ezpz(z)[log(1D(G(zc)))]

可以看到判别器还是生成器的概率表达公式都变为了条件概率,对于不同的标签 c c c,得到的优化目标也不完全相同,从而保证了我们能够通过更改 c c c 的值来控制输出图像的标签;

CGAN 的架构图如下:
在这里插入图片描述

三、生成对抗网络的应用

Generative Adversarial Text to Image Synthesis

Scott Reed 等人在2016年提出了一种 GAN 网络,可以实现文本生成图像,具体效果如下:

在这里插入图片描述
实现文本生成图像的 GAN 网络的架构如下:

在这里插入图片描述
类似于 CGAN,在文本生成图像的 GAN 网络中,在生成器和判别器上都加入了文本信息作为标签数据,文本的 embedding 通过编码器 φ \varphi φ 得到,判别器的优化目标为:

E t 1 , t 2 ∼ p d a t a [ l o g ( 1 − D ( G ( z , B t 1 + ( 1 − B ) t 2 ) ) ) ] \mathbb{E}_{t_1,t_2 \sim p_{data}}[log(1-D(G(z, \Beta t_1 + (1-\Beta)t_2)))] Et

  • 2
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值