在CNN网络中,一张图经过核为3 x 3,步长为2的卷积层,ReLU激活函数层,BN层,以及一个步长为2,核为2 x 2的池化层后,再经过一个3 x 3的的卷积层,步长为1,此时的感受野是?
感受野(Receptive Field)的定义:卷积神经网络每一层输出的特征图(feature map)上的像素点映射回输入图像上的区域大小。通俗点的解释是,特征图上一点,相对于原图的大小,也是卷积神经网络特征所能看到输入图像的区域。
1、感受野大小的计算方式是从最后一层 feature map 开始,往下往上的计算方法,即先计算最深层在前一层上的感受野,然后以此类推逐层传递到第一层;
2、感受野大小的计算不考虑padding的大小;
3、最后一层的特征图感受野的大小等于其卷积核的大小;
4、第 i i i 层特征图的感受野大小和第 i i i 层的卷积核大小和步长有关系,同时也与第 i + 1 i+1 i+1 层特征图的感受野大小有关。
感受野的计算公式:
其中,
R
F
RF
RFi 表示
i
i
i 层感受野大小,
i
i
i 表示当前特征层的层数,
s
t
r
i
d
e
stride
stride 是卷积的步长,
K
K
Ksize 是当前层卷积核的大小。
-
第二个3 x 3卷积层, s t r i d e stride stride =1:(1 - 1)x 1 + 3 = 3
-
第一个2 x 2池化层, s t r i d e stride stride =2:(3 - 1)x 2 + 2 = 6
-
第一个3 x 3卷积层, s t r i d e stride stride =2:(6 - 1)x 2 + 3 = 13
因此,此时的感受野是13。