如何计算感受野(Receptive Field)

最新推荐文章于 2024-07-29 23:06:07 发布

Sylvan Ding

最新推荐文章于 2024-07-29 23:06:07 发布

阅读量301

点赞数 2

分类专栏：计算机视觉（CV方向）文章标签：深度学习感受野计算机视觉

原文链接：https://zhuanlan.zhihu.com/p/28492837

版权

计算机视觉（CV方向）专栏收录该内容

13 篇文章 19 订阅

订阅专栏

深度神经网络中的感受野(Receptive Field)

本文转载自知乎：深度神经网络中的感受野(Receptive Field) - 蓝木达的文章 - 知乎

在机器视觉领域的深度神经网络中有一个概念叫做感受野，用来表示网络内部的不同位置的神经元对原图像的感受范围的大小。神经元之所以无法对原始图像的所有信息进行感知，是因为在这些网络结构中普遍使用卷积层和pooling层，在层与层之间均为局部相连（通过sliding filter）。神经元感受野的值越大表示其能接触到的原始图像范围就越大，也意味着他可能蕴含更为全局、语义层次更高的特征；而值越小则表示其所包含的特征越趋向于局部和细节。因此感受野的值可以大致用来判断每一层的抽象层次。

那么这个感受野要如何计算呢？我们先看下面这个例子。

在这里插入图片描述

可以看到在Conv1中的每一个单元所能看到的原始图像范围是3*3，而由于Conv2的每个单元都是由 2×2 范围的Conv1构成，因此回溯到原始图像，其实是能够看到 5×5 的原始图像范围的。因此我们说Conv1的感受野是3，Conv2的感受野是5. 输入图像的每个单元的感受野被定义为1，这应该很好理解，因为每个像素只能看到自己。

通过上图这种图示的方式我们可以“目测”出每一层的感受野是多大，但对于层数过多、过于复杂的网络结构来说，用这种办法可能就不够聪明了。因此我们希望能够归纳出这其中的规律，并用公式来描述，这样就可以对任意复杂的网络结构计算其每一层的感受野了。那么我们下面看看这其中的规律为何。

由于图像是二维的，具有空间信息，因此感受野的实质其实也是一个二维区域。但业界通常将感受野定义为一个正方形区域，因此也就使用边长来描述其大小了。在接下来的讨论中，本文也只考虑宽度一个方向。

接下来我们使用一种并不常见的方式来展示CNN的层与层之间的关系：

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。