CNN中的感受野(Receptive Field)

最新推荐文章于 2024-07-27 09:45:00 发布

狂奔的菜鸡

最新推荐文章于 2024-07-27 09:45:00 发布

阅读量518

点赞数

分类专栏：深度学习文章标签：计算机视觉神经网络卷积

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43786241/article/details/108629029

版权

深度学习专栏收录该内容

6 篇文章 0 订阅

订阅专栏

目录

面试问了感受野，以前学习过，忘了紧张没回答出来，淦！，来总结一下（哭唧唧），平时要注意知识的不停积累，学习过后的知识，整理思绪写在博客上可以加深印象。

简介

感受野：卷积神经网络每一层输出的特征图（feature map）上的像素点在输入图片上映射的区域大小。再通俗点的解释是，特征图上的一个点对应输入图上的区域。

以下图为例，假如输入为一个10x10的特征图，卷积核为7x7，步长为1，则感受野为：7。
在这里插入图片描述

感受野的计算

感受野的计算需要知道的计算量：

第 $i$ 层的卷积核大小 $k_i$ ，步长 $s_i$
第 $i - 1$ 层的感受野大小 $rf_{i-1}$

下面是感受野的一般计算公式：

在这里插入图片描述

举个例子，借用彻底搞懂感受野的含义与计算的图：
下图中每一个Layer的卷积大小都为3x3，步长为1，Layer1为输入特征图，则Layer2的感受野为3，Layer3相对于Layer2的感受野为3，相对于Layer1的感受野为5：
在这里插入图片描述
我们一起来分析一下这个计算感受野的式子，输入层Layer1的感受野为1（因为输入层每个像素点对应输入图像的一个像素点），Layer2的感受野为3（Layer2上的每个像素点对应Layer1的三个像素点），Layer3的每个像素点对应Layer1的5个像素点，对应Layer2的3个像素点。

现在分析一下计算公式：

第一层： $rf_i$ =1
第二层： $rf_2=k_2$
第三层：第三层可以看作第三层对应于第二层感受野 $k_{1}$ 除第一个元素外（第一个元素对应的感受野为 $rf_2$ ），剩下 $k_{i-1}$ 个元素在第一层图像上的扫过的范围，而这个扫过的范围和步长有关，即剩下的每一个元素都对应一个步长 $s_i$ ，即 $rf_2+(k_3-1)*s_2$
第四层：同样第四层可以看作第四层对应于第三层感受野 $k_{4}$ 除第一个元素外（第一个元素的感受野为 $rf_3$ ），剩下 $k_{4}-1$ 个元素在第一层图像上的扫过的范围，要求这个范围，先要求在第二层上扫过的范围，即 $k_4-1)*s_4$ ，则在第一层图像上的扫过的范围： $k_4-1)*s_3*s_2$ ，即第四层感受野为： $rf_3+(k_4-1)*s_3*s_2$
…

由此可见感受野大小的计算是个递推公式。

感受野的作用

来自牧世的文章中说的不错：神经元感受野的值越大，表示其能接触到的原始图像范围就越大，也意味着它可能蕴含了更为全局，语义层次更高的特征；相反，值越小则表示其所包含的特征越趋向局部和细节。因此感受野的值可以用来大致判断每一层的抽象层次。

狂奔的菜鸡

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
CNN中的感受野(Receptive Field)

        感受野：卷积神经网络每一层输出的特征图（feature map）上的像素点在输入图片上映射的区域大小。再通俗点的解释是，特征图上的一个点对应输入图上的区域。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

狂奔的菜鸡 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。