论文笔记:InfoGAN

InfoGAN发于NIPS2016,也就是GAN诞生的两年之内。InfoGAN解决了一个可能所有刚接触GAN的人都会想到的问题:如何控制生成数据的语义特征?

文中提出,原始GAN网络以不受任何限制的噪声Z作为输入,因而生成器只能以一种高度混乱的方式使用噪声,导致噪声Z中独立的维度与数据的语义特征不对应。

文中提出了解决方案,即分解输入噪声为两个部分。其中,Z作为不可压缩的噪声源,c作为潜在的code,对数据分布潜在结构进行导向。而生成器产生的输出为G(z,c)。原始GAN中相当于通过公式P_{G}(x|c)=P_{G}(x)忽视了输入c,本文中为了解决这个问题,提出c和G(z,c)之间应该有高度共同的特征。

在信息理论中,I(X;Y)作为从随机变量Y中获取到的随机变量X的信息:

I(X;Y)=H(X)-H(X|Y)=H(Y)-H(Y|X)

其中,H表示信息熵(对于信息熵上的解释见https://www.zhihu.com/question/22178202)。从直观上来说,I(X;Y)是当Y被观测之后X减少的不确定性。因此,为了使得潜在的code,c,在生成过程中不会丢失,I(c;G(z,c))值应该很高。因此将原始GAN优化公式改写如下:

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值