每个卷积层可视为三元组[kernel_size, stride, dilation],
每个最大池化层可视为二元组[1, stride]。
以一个类似Deeplabv3+的Resnet50为例。
总共有4个block,每个block的layer个数为:[3, 4, 6, 3]。
以最后一个block的参数为例,有[[3, 1, 1], [3, 1, 2], [3, 1, 4]]。
感受野计算代码如下:
layers = [[7, 2], [1, 2], [3, 1], [3, 1], [3, 1], [3, 2], [3, 1], [3, 1], [3, 1], [3, 2],[3, 1], [3, 1], [3, 1], [3, 1], [3, 1], [3, 1, 1], [3, 1, 2], [3, 1, 4]]
rf_stride = 1
rf = 1
for layer in layers:
if len(layer) == 2:
k = layer[0]
stride = layer[1]
if len(layer) == 3:
kernel_size = layer[0]
stride = layer[1]
dilation = layer[2]
k = (dilation-1)*(kernel_size-1)+kernel_size
rf = rf + rf_stride * (k-1)
rf_stride *= stride
print(rf)
其中,rf为当前层的每个神经元的感受野大小,k为真实的卷积核大小(与dilation系数有关),rf_stride为当前层的感受野步长,其为前馈网络父节点所有stride的连乘。则由rf = rf + rf_stride * (k-1)可计算出当前层的输出的感受野大小。