欢迎使用CSDN-markdown编辑器

photoed

于 2017-02-06 09:53:17 发布

阅读量294

点赞数

分类专栏： 2017.1 paper reading

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/photoed/article/details/54889972

版权

2017.1 paper reading 专栏收录该内容

0 篇文章 0 订阅

订阅专栏

Conditional Image Genearation with PixelCNN Decoders

论文来自google deepmind。主要思想可以归纳为：使用Pixel CNN产生一个新的image density model，并且given该density model来做image generation。比较吸引人的是，可以given一个其他网络生成的特征vector或者标签信息来完成，比如given一个ImageNet的label，这个image density model可以生成该label对应的人物，场景，动物，given一个人脸，可以生成该人物的不同表情，甚至是不同动作。
本Markdown编辑器使用StackEdit修改而来，用它写博客，将会带来全新的体验哦：

What is Pixel CNN

pixel cnn工公式定义如下：

p (x) = Π n 2 i p (x i | x 1, . . . x i - 1)

$p(x) = \Pi_{i}^{n^{2}}{p(x_{i}|x{1},...x_{i-1})}$

用论文中的一副图来解释Pixel CNN
Pixcel CNN 图解

从图1可以看出，在CNN的感受野范围内，每个pixel都depends on该pixel的左上方所有的pixels。在Pixel RNN中，每个pixel 同样depends on 该pixel左上方的所有pixels，不过这些左上方的pixels是使用一个Grid LSTM来进行编码。

Grid LSTM编码的效果比Pixel CNN的效果好，但是Pixel CNN可以利用卷积并行计算，效率比 Grid LSTM高太多，工程上Grid LSTM效率是个大问题，并且在此论文中，提出了 gated Pixel CNN，效果能与Grid LSTM相当。

Pixel CNN并行计算时需要给每个感受野加一个mask 矩阵，如图2所示。这个mask矩阵保证了每个感受野中的所有pixel在卷积过程中不会看到该pixel右下方的pixel。

What is Gated Pixel CNN

简单粗暴点的说，Gated Pixel CNN就是在Pixel CNN的ReLU用一个tanh和sigmoid的激活函数代替，用公式表示为：

y = t a n h (W k, f * x) ⊙ σ (W k, g * x)

$y=tanh(W_{k,f}*x)\odot\sigma(W_{k,g}*x)$

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
欢迎使用CSDN-markdown编辑器

Conditional Image Genearation with PixelCNN Decoders论文来自google deepmind。主要思想可以归纳为：使用Pixel CNN产生一个新的image density model，并且given该density model来做image generation。比较吸引人的是，可以given一个其他网络生成的特征vector或者标签信息来完成
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。