感受野(Receptive Field)的理解与计算

一、 定义

在卷积神经网络中,感受野(Receptive Field)是指特征图上的某个点能看到的输入图像的区域,即特征图上的点是由输入图像中感受野大小区域的计算得到的。
在这里插入图片描述
神经元感受野的值越大表示其能接触到的原始图像范围就越大,也以为这它可能蕴含更为全局,语义层次更高的特征;相反,值越小则表示其所包含的特征越趋向局部和细节。因此感受野的值可以用来大致判断每一层的抽象层次。

二、计算

卷积层(conv)和池化层(pooling)都会影响感受野,而激活函数层通常对于感受野没有影响,当前层的步长并不影响当前层的感受野,感受野和填补(padding)没有关心,计算当前层感受野的公式如下:

在这里插入图片描述
其中 RF_i+1 表示当前层的感受野,RF_i 表示上一层的感受野,k表示卷积核的大小,例如3*3的卷积核,则k=3,S_i 表示之前所有层的步长的乘积(不包括本层),公式如下:
在这里插入图片描述
下面来练练手,以AlexNet举个例子:
在这里插入图片描述
我的一部分计算过程:

Raw = 1
Conv1 = 1+(11 - 1) x 1 = 11
Pool1 = 11+(3 - 1) x 4 = 19
Conv2 = 19+(5 - 1) x 4 x 2 = 51
·······

三、拓展

通常上述公式求取的感受野通常很大,而实际的有效感受野(Effective Receptive Field)往往小于理论感受野,因为输入层中边缘点的使用次数明显比中间点要少,因此做出的贡献不同,所以经过多层的卷积堆叠后,输入层对于特征图点做出的贡献分布呈高斯分布形状。

在使用Anchor作为强先验区域的物体检测算法中,如Faster RCNN 和 SDD,如何设置Anchor的大小,都应该考虑感受野,尤其是有效感受野,过大或过小都不好。

本文完全搬运自知乎博主 玖零猴,仅用于自己学习中的记录分享,防止原文失效。
B站视频

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

梦在黎明破晓时啊

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值