感受野：The receptive field

最新推荐文章于 2024-02-29 19:36:38 发布

Fan_shui

最新推荐文章于 2024-02-29 19:36:38 发布

阅读量553

点赞数

分类专栏：深度学习那些事文章标签：感受域深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Fan_shui/article/details/83064497

版权

深度学习那些事专栏收录该内容

2 篇文章 0 订阅

订阅专栏

The receptive field is defind as the region in the input space that a particular CNN’s feature is looking at.

参考文章：
https://zhuanlan.zhihu.com/p/26663577
https://www.jianshu.com/p/2b968e7a1715
读了上面两篇文章后对感受野有点理解了。若有误，请指正~

　　　　　　　　　　　　　　图一
上图是两个卷积过程，详细过程如下图：

　　　　　　　　　　　　　　　　　图二
　　（注：上图卷积过程中没有任何填充）
　　我们来看看receptive field 的计算。对于conv1来说，feature map的大小为3x3，这3x3里面的任何一个元素都是由3x3的fliter做卷积得来的，所以它的reptive field为3。
　　conv2后得到的feature map大小为2x2，feature map中每一个元素都是由上一个feature map 3x3中的四个元素与2*2的fliter做卷积得来的。而这四个元素可以很容易的看出是由Raw image中的5x5元素得来的，如下图：
　　在这里插入图片描述
　　　　　　　　　　　　　　　图三
所以我们可以说conv2的感受野大小为5

在这里插入图片描述
　　　　　　　　　　　　　　　图四
上图与之前的图不一样，它多了填充的过程，如下图：

　　　　　　　　　　　　　　图5
　　我们先来分析下卷积的前向传播过程。输入为5x5，第一次卷积的时候进行了填充（其实填充后的大小为7x7），填充后用3x3的fliter滑动，得到3x3的feature map。3x3的feature map经过填充（填充后为5x5），也同样的用3x3的fliter滑动，得到2x2的feature map。

在这里插入图片描述
　　现在我们从后往前分析，如上图（图丑，凑合看吧~）。最后一层的2x2的feature map中的每一个元素都是由第二层的feature map中的3x3特征值做卷积得来的，其中这个3x3是包含了填充的。即每一个元素都是由第二层的3x3个元素做卷积得来的。
　　我们假设a11，a21这些元素不是填充的，而是由第一层做卷积得到的。我们先看下a22这个元素，它应该是input image经填充后做卷积得到的，即图中的黑色虚线框与fliter做卷积得到的。试想一下，a21的值应该怎么得到呢？我们的fliter为3x3，stride=2，所以要想得到a21，是不是应该把我们的黑色虚线框左移两个单位，所以我们再填充两个，就左边在原来5x5的基础上填充了三个。同理，要得到a11我们只需要把刚才的框再往上填充两个，这样的话相当于上面也填充了3个，因为是对称的，所以整张图像成了11x11的大小，这样就明白了为什么图四中底层是11x11的大小了。
　　经过上述分析后，感受野的大小应该也可以清楚的知道了，a11到a33这9个数是跟上一层的7x7个元素有关的，所以我们可以说感受野为7。
　　还有最后一点，为什么我要把那个填充的当作是由上一层卷积得来的呢。我们可以看看a33这个元素，它的感受野就没有包括填充的部分，全都是5x5里面的元素，a11只是讲解方便一点。

以上内容纯属自己瞎琢磨的，若理解不当，望指正~

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。