卷积和反卷积核计算公式

最新推荐文章于 2025-03-03 18:34:05 发布

npupengsir

最新推荐文章于 2025-03-03 18:34:05 发布

阅读量1.2w

点赞数 15

分类专栏： pytorch 文章标签： pytorch 深度学习

本文链接：https://blog.csdn.net/u012897374/article/details/114381786

版权

pytorch 专栏收录该内容

13 篇文章

订阅专栏

1. 卷积

输出:
$out\_size = \frac{in\_size+2\times padding - kernel\_size}{stride} + 1$

如果想让输入和输出大小一样，则stride必须为1，并且:
$\frac{kernel\_size-1}{2}$
因此kernel应该为奇数。
比较常用的组合为: kernel_size=3, padding=1, stride=1和kernel_size=5, padding=2, stride=1。

如果想让输出为输入的一半，则: stride=2且
$\frac{kernel-1}{2}$
常用组合为:stride=2, kernel=3, padding=1。注意如果出现除不尽的情况，则一律向下取整。

对于pooling，计算和conv一样。不过pooling没有padding，因此:
$out\_size = \frac{in\_size-kernel}{stride}+1$

2. 反卷积

转置卷积的计算公式为:
$out\_size = stride\times (in\_size-1)+kernel$
转置卷积中的padding作用于卷积正好相反，是将最外层的去掉一圈，所以带有padding的反卷积输出为:

$out\_size = stride\times (in\_size-1)\times + kernel - 2\times padding$

如果要像conv那样在外围加0的话，pytorch中可以使用output_padding参数。

实现2倍上采样，需要: stride=2, kernel_size=2*padding+2。

常用组合为:stride=2, kernel=2, padding=0、stride=2, kernel_size=4, padding=1, 这样能实现2倍上采样:
$\begin{aligned} out\_size &= 2\cdot (in\_size-1)+2-2\cdot 0 \\ &= 2\cdot in\_size \end{aligned}$

3. 卷积中的dilation

dilation又称为 atrous convolutions，即在卷积核的相邻元素之间增加spacing。dilation_rate由参数d控制，通常添加d-1个空格进入kernel中。d=1时表示普通的卷积操作。

dilated conv可以在不增加卷积核大小的情况下增大感受野，同时不增加额外开销，在多个扩张卷积逐次堆叠的情况下尤其有效。

dilated conv有效卷积核大小为:
$\hat k = k + (k − 1)(d − 1)$
因此dilated conv的输出大小为:

$\begin{aligned} o_size =& \frac{in_{size} + 2\cdot padding - \hat k}{stride} + 1 \\ =& \frac{in_{size} + 2\cdot padding - k - (k+1)\cdot (d-1)}{stride} + 1 \end{aligned}$

举例如下:
在这里插入图片描述