感受野:The receptive field

The receptive field is defind as the region in the input space that a particular CNN’s feature is looking at.

参考文章:
https://zhuanlan.zhihu.com/p/26663577
https://www.jianshu.com/p/2b968e7a1715
读了上面两篇文章后对感受野有点理解了。若有误,请指正~

图一
              图一
上图是两个卷积过程,详细过程如下图:
图二
                 图二
  (注:上图卷积过程中没有任何填充)
  我们来看看receptive field 的计算。对于conv1来说,feature map的大小为3x3,这3x3里面的任何一个元素都是由3x3的fliter做卷积得来的,所以它的reptive field为3。
  conv2后得到的feature map大小为2x2,feature map中每一个元素都是由上一个feature map 3x3中的四个元素与2*2的fliter做卷积得来的。而这四个元素可以很容易的看出是由Raw image中的5x5元素得来的,如下图:
  在这里插入图片描述
               图三
所以我们可以说conv2的感受野大小为5

在这里插入图片描述
               图四
上图与之前的图不一样,它多了填充的过程,如下图:
在这里插入图片描述
              图5
  我们先来分析下卷积的前向传播过程。输入为5x5,第一次卷积的时候进行了填充(其实填充后的大小为7x7),填充后用3x3的fliter滑动,得到3x3的feature map。3x3的feature map经过填充(填充后为5x5),也同样的用3x3的fliter滑动,得到2x2的feature map。

在这里插入图片描述
  现在我们从后往前分析,如上图(图丑,凑合看吧~)。最后一层的2x2的feature map中的每一个元素都是由第二层的feature map中的3x3特征值做卷积得来的,其中这个3x3是包含了填充的。即每一个元素都是由第二层的3x3个元素做卷积得来的。
   我们假设a11,a21这些元素不是填充的,而是由第一层做卷积得到的。我们先看下a22这个元素,它应该是input image经填充后做卷积得到的,即图中的黑色虚线框与fliter做卷积得到的。试想一下,a21的值应该怎么得到呢?我们的fliter为3x3,stride=2,所以要想得到a21,是不是应该把我们的黑色虚线框左移两个单位,所以我们再填充两个,就左边在原来5x5的基础上填充了三个。同理,要得到a11我们只需要把刚才的框再往上填充两个,这样的话相当于上面也填充了3个,因为是对称的,所以整张图像成了11x11的大小,这样就明白了为什么图四中底层是11x11的大小了。
   经过上述分析后,感受野的大小应该也可以清楚的知道了,a11到a33这9个数是跟上一层的7x7个元素有关的,所以我们可以说感受野为7。
   还有最后一点,为什么我要把那个填充的当作是由上一层卷积得来的呢。我们可以看看a33这个元素,它的感受野就没有包括填充的部分,全都是5x5里面的元素,a11只是讲解方便一点。

以上内容纯属自己瞎琢磨的,若理解不当,望指正~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值