InfoGAN中公式5的理解

博主分享了自己在阅读InfoGAN论文过程中对公式5的理解,指出G(z,c)是一个条件概率,代表给定c条件下生成器生成图片x的概率。由于数学水平限制,可能存在错误,并希望得到指正。" 106166825,8217837,面试必备:网络计算问题详解,"['网络基础', 'TCP/IP协议', '数据链路层', '网络设备', '网络协议']
摘要由CSDN通过智能技术生成

最近读了InfoGAN的论文,其中公式5我一直不是很理解,但在网上搜索也没搜到类似的问题。现记录一下个人对公式5的理解,如有错误恳请指正。
InfoGAN: https://arxiv.org/pdf/1606.03657.pdf

论文在公式4中给出了 I(c;G(x,z)) I ( c ; G ( x , z ) ) 的下界

I(c;G(x,z))ExG(z,c)[EcP(c|x)[logQ(c|x]]+H(c) I ( c ; G ( x , z ) ) ≥ E x ∼ G ( z , c ) [ E c ′ ∼ P ( c ′ | x ) [ l o g Q ( c ′ | x ] ] + H ( c )

但是该下界仍然涉及到后验概率 P(c|x) P ( c ′ | x ) ,这里的x指的就是生成器 G G 生成的图片而c则是Latent code。这个概率是无法直接估计的,因此文章中使用引理5.1对该下界进行了一个变换。

引理5.1:
For random variables X, Y and function f(x, y) under suitable regularity conditions:

ExX,yY|x[f(x,y)]=ExX,yY|x,xX|y[f(x|y)] E x ∼ X , y ∼ Y | x [ f ( x , y ) ] = E x ∼ X , y ∼ Y | x , x ′ ∼ X | y [ f ( x ′ | y ) ]

该定理证明见原论文附录。

下面给出公式5的个人理解, 关键在于如何理解 G(z,c) G ( z , c ) , 若 G(z,c)=cP(c)PG(x|c) G ( z , c ) = ∫ c P ( c ) P G ( x | c ) , 则

L1(G,Q)=ExG(z,c)[EcP(c|x)[logQ(c|x]]+H(c)=EcP(c),xPG(x|c),cP(c|x)[logQ(c|x)]+H(c)=EcP(c),xPG(x|c)[logQ(c|x)]+H(c) L 1 ( G , Q ) = E x ∼ G ( z , c ) [ E c ′ ∼ P ( c ′ | x ) [ l o g Q ( c ′ | x ] ] + H ( c ) = E c ∼ P ( c ) , x ∼ P G ( x | c ) , c ′ ∼ P ( c ′ | x ) [ l o g Q ( c ′ | x ) ] + H ( c ) = E c ∼ P ( c ) , x ∼ P G ( x | c ) [ l o g Q ( c | x ) ] + H ( c )

这里第二步到第三部的变换使用了引理5.1。

这里的 PG(x|c) P G ( x | c ) 对应的是原论文中的式5第一行的G(z, c), 实际上这里的G(z, c)已经是一个条件概率了(与论文中式4(本文中的第一个公式中)的 G(z,c) G ( z , c ) 其实并不是同一个东西),代表在给定c的条件下生成器产生图片x的概率。因此接下来可以用蒙特卡洛来对 L1(G,Q) L 1 ( G , Q ) 进行估计。

以上只是我个人的理解,数学水平着实有限,如有错误恳请指正!

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值