先定义几个参数
- 输入图片大小 W×W
- Filter大小 F×F
- 步长 S
- padding的像素数 P
于是我们可以得出
N = (W − F + 2P )/S+1
输出图片大小为 N×N
这个公式的理解:以w方向为例,宽度为W(相当于W个像素点),pad相当于增加的尺寸(相当于增加了像素点),pad的值一般是指w方向的某一个方向增加的像素的个数(比如左侧右侧),所以要乘以2,尺寸就变成了W+2P,相当于你现在需要这么大的像素点进行卷积操作。除了第一次,卷积需要处理filter尺寸大小的像素,后面的卷积虽然尺寸都是F,但是新增的只有滑动的像素(也就是stride的大小)。这样你把w方向总的像素点减去第一次卷积的尺寸,剩下的像素点个数就都是通过stride滑动,做一个除法就相当于求一共要滑多少次,滑了多少次也就进行了多少次卷积,也就生成了多少个下一层的像素点,+1的操作也就是把第一次的卷积加上,对应的就是最终生成的feature map w方向的像素点个数。