定义: 卷积神经网络每一层输出的特征图(feature map)上的像素点在原始图像上映射的区域大小。

设网络共有 N 层卷积层, 卷积核采用正方形, 记第 i 层卷积核大小为 \(size_i\), 步长为 \(stride_i\), 当我们计算 \(feature \space map\) 经过第 N 层卷积(或者池化), 输出的一个 "像素"对应的感受野时, 计算过程如下(从上到下计算, 计算最后所得值就是对应的感受野), \(field_{N}\) 表示经过第 N 层卷积之后的 feature map 上一个像素点对应的感受野(只看宽度).
\[ \begin {align*} &field_{N} = size_N \\ &\quad \quad \vdots \\ &field_{i} = (field_{i+1} - 1) \times stride_{i} + size_i \\ &\quad \quad \vdots \\ &field_{1} = (field_{2} - 1) \times stride_{1} + size_1\\ \end {align*} \]
\(field_{1}\) 即为所求感受野.
\(\color{red}{举例如下(\bf ZFNet)}\):

第 8 层为最后一个 feature map 大小为 13x13 这一层, 171 为该层 3 个像素在图片的感受野大小
layer | size | stride | 计算 |
---|---|---|---|
8th | 3 | 1 | 3 |
7th | 3 | 1 | (3-1)×1 + 3 = 5 |
6th | 3 | 1 | (5-1)×1 + 3 = 7 |
5th | 3 | 1 | (7-1)×1 + 3 = 9 |
4th | 3 | 2 | (9-1)×2 + 3 = 19 |
3rd | 5 | 2 | (19-1)×2 + 5 = 41 |
2nd | 3 | 2 | (41-1)×2 + 3 = 83 |
1st | 7 | 2 | (83-1)×2 + 2 = 171 |