阅读小结：InfoGAN:Interpretable Representation Learning by Information Maximising Generative Adversarial

最新推荐文章于 2024-04-21 10:42:24 发布

Layumi1993

最新推荐文章于 2024-04-21 10:42:24 发布

阅读量5.1k

点赞数 1

分类专栏：论文阅读文章标签：对抗网络深度学习神经网络 GAN InfoGAN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Layumi1993/article/details/52474554

版权

之前GAN中都没有加入分类信息，都是耍流氓啊。用原始maxD的时候，G学到的容易收敛到一个固定图像。

而用feature matching的话，相同向量可能每次match的都不同，这怎么regression啊，摔（也可能我是用姿势不对，但有多类的feature matching不靠谱啊）

What:

1.通常GAN把一个随机噪声向量z生成为一张图像。z可能从一个 0到1的随机采样构成。

2.这样连累了GAN中的每个值的作用

－因为即使你改了向量中一个值，对生成图片的影响也是很小的。一定要改变很多个值去影响生成的结果。

－每个值应该是有实际含义的（即文题中的interpretable，可翻译的），理想情况下，每个值应该都有物理含义，比如在人脸生成任务中，一个值控制眼睛的颜色，一个控制头发的长度等等。（类似分类最后fc的每个值都有含义的，虽然定义不了）

3.所以作者建议对GANs基于共同信息（mutual information）的改进，将会得到有意义的向量元素（每个值）

How

1.潜在编码 latent code c

－原来的GAN G的输出为 G(z) 现在改为 G(z,c)

－ c可以包含多种变量，根据不同的分布，比如在MNIST中，c可以一个值来表示类别，一个高斯分布的值来表示手写体的粗细

2.共同信息 mutual information

－如果使用潜在编码c，

最低0.47元/天解锁文章

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
7
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 7

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Layumi1993 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。