大部分转自:https://blog.csdn.net/qq_36444039/article/details/103984502
笔者以前搭建深度学习模型的时候,对于每一步卷积池化后图片的尺寸和大小很迷茫,不知道如何计算的。
这里,我给大家分享几个公式,帮助大家理解。不明白的欢迎在下方留言。
1、卷积层(Conv Layer)的输出张量(图像)的大小
定义如下:
O=输出图像的尺寸。
I=输入图像的尺寸。
K=卷积层的核尺寸
N=核数量
S=移动步长
P =填充数
输出图像尺寸的计算公式如下:
上述公式的 分式部分 向下取整
公式推导
:画出图片,将卷积核顶在图片的最左上角,从卷积核的右边缘开始考虑。
卷积核的右边缘位于第K个位置,还剩下L-K+2*P个位置可以去移动,一次向右移动S步。
所以,卷积核还能移动(I-K+2P)\S (向下取整)
步。再加上本身就处在的位置,所以总共是(I-K+2P)\S(下取整)+1
如果需要保持原来的尺寸
:通常S = 1,K = 2P+1