Pytorch中的转置卷积

最新推荐文章于 2024-05-07 16:15:12 发布

小王同学w

最新推荐文章于 2024-05-07 16:15:12 发布

阅读量2.5k

点赞数 1

分类专栏：笔记文章标签： python pytorch cv

本文链接：https://blog.csdn.net/a171232886/article/details/121475087

版权

笔记专栏收录该内容

39 篇文章 2 订阅

订阅专栏

Pytorch中的转置卷积

转置卷积(Transposed Convolution)
输出大小计算
综合起来
参考文献

转置卷积(Transposed Convolution)

又称为反卷积。

torch.nn.ConvTranspose2d(in_channels, out_channels, kernel_size, stride=1, padding=0, output_padding=0, groups=1, bias=True, dilation=1, padding_mode='zeros')

输出大小计算

先说结论
$o^{'} = (i^{'} - 1) s + k - 2 p + p^{'}$
$p^{'}$ 是output_padding，后面一直是在分析这个式子是怎么来的。
注：当有空洞卷积时，k=dilation[0]×(kernel_size[0]−1)+1

起点

首先回顾正常的卷积计算公式
$\left\lfloor {\frac{{i - k + 2p}}{s}} \right\rfloor + 1$
其中， $i$ 表示输入大小， $o$ 表示输出大小， $k$ 表示卷积核大小， $p$ 表示pading， $s$ 表示卷积步长。正常来说， $i > = o$

反卷积的输入 $i^{'}$ 输出 $o^{'}$ ，而此时 $i^{'} < = o^{'}$ 。（毕竟我们的目的是放大图像。）带入上式得到以下，我们需要根据下面式子，反推出 $o^{'}$ 。

$\left\lfloor {\frac{{o' - k + 2p}}{s}} \right\rfloor + 1$

麻烦的是向下取整，所以分类讨论：

可以整除

即当 ${o' - k + 2p})\%{s}=0$ 时，上式变为，
$\frac{{o' - k + 2p}}{s} + 1$
此时反卷积的输入 $i^{'}$ 输出 $o^{'}$ 可以一一对应。
$o^{'} = (i^{'} - 1) s + k - 2 p$

代码验证

>>> x = torch.ones([1,10,5,5])
>>> a2 = torch.nn.ConvTranspose2d(in_channels=10,
                              out_channels=10,
                              kernel_size=3,
                              stride=2,
                              padding=0,
                              output_padding=0)
>>> y = a2(x)
>>> print(y.shape)

torch.Size([1, 10, 11, 11])

也就是当 $i^{'} = 5 ， k = 3 ， s = 2 ， p = 0$ 时， $o^{'} = 11$ 。

不可以整除

即当 $2p})\%{s} \ne0$ 时，向下取整不能去掉时。我们减去一部分，让它能取整。我们定义 $2p)\% s$ ，也就是output_padding

$\begin{aligned} i' &= \frac{{o' - k + 2p - (o' - k + 2p)\% s}}{s} + 1 \\ &= \frac{{o' - k + 2p - p'}}{s} + 1 \end{aligned}$
反推得到 $o^{'} = (i^{'} - 1) s + k - 2 p + p^{'}$

代码验证

>>> x = torch.ones([1,10,4,4])
>>> a2 = torch.nn.ConvTranspose2d(in_channels=10,
                              out_channels=10,
                              kernel_size=3,
                              stride=2,
                              padding=0,
                              output_padding=1
                              )
>>> y = a2(x)
>>> print(y.shape)

torch.Size([1, 10, 10, 10])

也就是当 $i^{'} = 4 ， k = 3 ， s = 2 ， p = 0 ， p^{'} = 1$ 时， $o^{'} = 10$ 。

回过头来说，这样直接减去一项合理吗？看着不合理，其实很合理。毕竟标准卷积也是向下取整。而这里只是取下界：

综合起来

前面一直是反推反推，还得考虑是否整除。难道你还让计算机挨个去世吗？显然不是，计算机知道的只是下面这个式子，
$o^{'} = (i^{'} - 1) s + k - 2 p + p^{'}$
等式右边的参数全都可以控制输入，也就是控制了输出。前文只不过是对这个式子的理解，当 $p^{'} = 0$ 是整除情况，当 $p'\ne0$ 是不可整除情况。

参考文献

https://www.cnblogs.com/kk17/p/10111768.html
https://www.zhihu.com/question/48279880
https://pytorch.org/docs/1.4.0/nn.html?highlight=torch%20nn%20convtranspose2d#torch.nn.ConvTranspose2d

小王同学w

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
Pytorch中的转置卷积

反卷积反卷积(Transposed Convolution)输出大小计算起点可以整除不可以整除综合起来参考文献反卷积(Transposed Convolution)又称为转置卷积。torch.nn.ConvTranspose2d(in_channels, out_channels, kernel_size, stride=1, padding=0, output_padding=0, groups=1, bias=True, dilation=1, padding_mode='zeros')输出大小
复制链接

扫一扫

专栏目录