超详细的卷积后大小的计算公式

最新推荐文章于 2025-03-04 22:04:01 发布

惊醒幡然1

最新推荐文章于 2025-03-04 22:04:01 发布

阅读量4.6w

点赞数 51

分类专栏： DeepLearning

本文链接：https://blog.csdn.net/Mr_WHITE2/article/details/112334812

版权

DeepLearning 专栏收录该内容

5 篇文章

订阅专栏

计算公式定义

定义几个参数

输入图片大小 W×W
卷积核大小 F×F
步长 S
padding的像素数 P
于是我们可以得出计算公式为：
N = (W − F + 2P )/S+1

输出图片大小为 N×N
以resnet50为例，输入为[1,3,224,224]，其中1为batchsize，3为通道数，224为height和width。

经过第一层卷积后，其大小为[1,64,112,112]

in_channels= 3//输入通道
out_channels= 64 //输出通道
nn.Conv2d(in_channels, out_channels, kernel_size=7, stride=2, padding=3, bias=False)

N = (W − F + 2P )/S+1 = （224-7+2x3）/2 + 1 = 112

解释

1为batchsize，不改变。
对于通道数，会生成与设定的输出通道个数相同个数的卷积核，对图片进行卷积，即卷积核的个数等于输出特征图的通道数。
得到最终输出大小为[1,64,112,112]
(W − F + 2P )相当于计算除了第一次卷积后剩下的可用来卷积的大小
(W − F + 2P )/S为按照S大小的步长在刚刚得到的大小上可以向后移动多少次，即还可以做几次卷积
因为不包括第一次卷积，所以再加上一个1，
即N = (W − F + 2P )/S+1
输出大小 = （图片宽或高 - 卷积核大小 + padding大小）/ 步长 + 1
对于宽和高不同的图片可分别用上述公式计算，得到最终的输出大小。

卷积动态图解参考：
https://cs231n.github.io/assets/conv-demo/index.html