写在前面
在研究论文的时候,看到了一张图像经过感受野提取特征后,得到的输出特征图大小与步长Stride
之间的关系,当时有点不太懂,后来自己画图实现了一下特征提取的过程,便一目了然了,正如华罗庚先生所讲的,“数无形时少直觉,形少数时难入微”。
问题
“输入一张800*800的图片,图片经过主干网络提取特征后,特征图缩放步长(stride)为32,因此,图像的边长是输入时的1/32”。
图示推导过程
看到刚才这个问题的时候,脑海中产生了很多问号,为什么步长是32,输出特征图大小就是原图的1/32呢?带着这个疑问,自己动手画了特征提取的过程图,如下图所示:
如图所示,对于一张 9 * 9
的原始图像,使用 3 * 3
的感受野提取特征,步长分别设置为2
或3
,最后提取得到的特征图大小分别为 4 * 4
和 3 * 3
,也即9/2 * 9/2
和 9/3 * 9/3
。因此可见对于一张输入图像,感受野提取得到的特征图大小与步长Stride
之间是有密切关系的。