关于感受野的总结

zhouweipzx

已于 2023-04-22 14:19:38 修改

阅读量140

点赞数 2

分类专栏：语义分割文章标签：深度学习人工智能

于 2023-04-21 19:34:33 首次发布

本文链接：https://blog.csdn.net/m0_56485336/article/details/130293827

版权

1 篇文章 0 订阅

订阅专栏

感受野是每个神经元仅与输入神经元相连接的一块区域。通俗的讲，就是该层输出特征图上的一点映射到输入特征图的区域大小。可以说成，神经元所看到的输入特征图的区域大小。

ps：我当时就说怎么公式不一样，原来有两个。。。

公式1：
$RF_{n} = RF_{n-1} +(K_{n}- 1)*\prod_{i=0}^{n-1}Stride_{i}$
注意： $RF_{n-1}$ 为第n-1层输出特征图的感受野大小，其中 $RF_{0}=1$ 。
公式2：
$RF_{n} = (RF_{n+1}-1) *Stride_{n}+K_{n}$
注意：从上往下推导， $RF_{n+1}$ 为第n+1层输出特征图的感受野大小，其中最后一层输出特征图的感受野大小为其kernel_size大小。

例如在VGGNet中，采用3x3卷积组合代替大尺寸的卷积（两个3x3的卷积可以代替5x5卷积来获得相同的感受野），可减少网络参数、增加网络深度。
在分类任务中，感受野一般要大于输入图像的大小，因为大的感受野可以让你忽略的信息更少。但也不能太大，一般我们在设计卷积神经网络时，对于最高层网络特征感受野大小的存在限制。
在目标检测中，放置anchor层的感受野的大小一般要与anchor大小差不多。如果感受野大于anchor大小的话，就像给你一张世界地图，就让你去检测到故宫的位置。说白了就是你看到的信息太多了，难以做出正确的判断。同理，如果感受野小于anchor的大小，得到的信息太少也难以检测到正确的结果。