转置卷积（逆卷积）A guide to convolution arithmetic for deep learning 阅读笔记

最新推荐文章于 2022-05-13 20:18:59 发布

shinra1012

最新推荐文章于 2022-05-13 20:18:59 发布

阅读量410

点赞数 1

文章标签：深度学习

本文链接：https://blog.csdn.net/shinra1/article/details/110917317

版权

首先，转置卷积有时被称为逆卷积但这是不准确的，因为这个过程不是数学的逆运算不推荐使用转置卷积的说法

input->卷积->转置卷积->output
input 与output并不同
有时被称为逆卷积是因为 output与input有相同的shape
然后keep in mind that 对于转置卷积都有一个与其等价的普通卷积的形式不过要在输入上做一些变化

众所周知一般卷积操作会使图片shape越来越小而转置卷积可以用来增大shape 故一般用于上采样

众所周知卷积操作可以看作矩阵相乘
44的input经过33的卷积核得到2*2的output
可以看作一个(1，16)@(16，4)=(1，4)
那么反过来把（1，4）来乘以（16，4)transpose =(1，16)就变回了原来的大小
#图片来自：https://blog.csdn.net/tsyccnh/article/details/87357447，侵删

从这个角度理解起来似乎比较简单…但还是不知道具体怎么操作（
首先转置卷积可以看作把卷积的output作一些变化之后的卷积

如果想增大卷积操作的输出shape 比较自然地会想到zero padding
但是单纯的增加padding，虽然保证了输出shape增大但是却没有考虑数据之间的关系（比如p如果大于卷积核就必然出现边缘一个0，这显然不是想要的）

https://arxiv.org/abs/1603.07285文中作者是这么解释的
考虑一个 (4,4) 的input 经过(3,3)的卷积（步长为1 padding为0）
i = 4, k = 3, s = 1 and p = 0
output: (2,2)
这个很好想象图就无了
注意到 input 左上角的元素只影响了output左上角的元素

那么在转置卷积中我们通过补0操作让output '（也就是转置卷积的输出）只受
input '(这里也就是转置卷积的输入，普通卷积的输出）的左上角的元素影响
为了维持这种关系

#Im not sure if I get the essence...

如图：
i = 4, k = 3, s = 1 and p = 0
也就是说 zero_padding’=2(p’=2)
比较容易的得到一个关系式子
p’ = k − 1
o '= i '+(k-1)

对于步长仍为1 但有zero_padding的卷积的转置卷积的等价卷积

它只需要更少的zero_padding ’
p’=k-p-1
o '=i '+(k-1)-2p

#关于这些式子的推出步骤一会考虑步长后一并给出这个例子就是s=1时的特例

但对于步长不为1的卷积操作的转置卷积呢（s>1)
应该有个与该转置卷积对应的步长（s<1)的卷积…
做法是output（卷积的输出为网络中转置卷积的输入）的每列每行间插入0
注意与转置卷积等价的卷积步长总为1，如图
s=2的话 output间插（2-1) 个0
s=s 插(s-1)个0
怎么补图为s=2的情况插入了1个0

#注意 这个例子中包含了一个zero_padding' （p'=1)

也就是
i’=o+(o-1)*(i-1)
而
o=(i-k+2p)/s+1

o’=(i’-k+2p’)/1 +1

i=o’

其中i为卷积操作input的边长（正方形）
i‘是o经过插0后得到的结果 shape
o是卷积得到的结果在神经网络中这一般是转置卷积的输入但不是文中的i’
文中的i’是与该转置卷积等价的卷积操作中经过插值之后的结果留意数学式比较好理解

解出
p’=k-p-1
o’=i’+k-2p-1

计算
o’=(o+(s-1)(o-1)+2*(k-p-1)-k)/1 +1

#     i' 	         p'

化简得
o’=(o-1)*s-2p+k

对应pytorch文档
在这里插入图片描述 Hin换成o就一样了（
我觉得为什么要这么插0 补0 是为了维持某种关系而其结果上表现如此

说法有点乱建议看下论文~~但我觉得论文里说的也挺乱的~~ ：
https://arxiv.org/abs/1603.07285
参考的还有：
https://blog.csdn.net/qq_27261889/article/details/86304061
https://blog.csdn.net/tsyccnh/article/details/87357447

如果有错误请指正