感受野

最新推荐文章于 2023-07-11 11:23:15 发布

寻梦梦飞扬

最新推荐文章于 2023-07-11 11:23:15 发布

阅读量1k

点赞数

分类专栏：深度学习

本文链接：https://blog.csdn.net/weixin_41043240/article/details/80335997

版权

深度学习专栏收录该内容

24 篇文章 4 订阅

订阅专栏

感受野：在卷积神经网络CNN中，决定某一层输出结果中一个元素所对应的输入层的区域大小，被称作感受野receptive field。
注意：这里的输入层并不一定是原始图像，可能对原始图像进行了填充。

这里写图片描述

如上图所示，第一次卷积，卷积核大小（kernel size）k=3*3，填充大小（padding size）p=1*1，步长（stride）s=2*2，（如图左上）对5*5的输入特征图进行卷积生成3*3的绿色特征图；第二次卷积，卷积核大小（kernel size）k=3*3，填充大小（padding size）p=1*1，步长（stride）s=2*2，（如图左下）对上面绿色的特征图采用相同的卷积操作生成2*2的橙色特征图。最后（图右）按列可视化CNN特征图，使卷积后的图像与原图像大小一致，中间用空白填充，可以看到特征位置即感受野的中心位置。
这里对padding做一个解释，首先第一层卷积在原始（蓝色）图像外围增加1个像素的填充，第二层卷积在第一层的结果（绿色图像）外围增加1个像素的填充，对应到原来的图像就需要再增加2个像素的填充，也就是原图像一共向外填充3个像素，也就是图中白色虚线网格。这里对填充的理解会影响后面感受野尺寸的理解。

感受野计算

这里写图片描述
如上图：
n：卷积后图像尺寸
r：感受野尺寸
j：跳跃尺寸
start：感受野中心坐标
k：卷积核尺寸
p：填充尺寸
s：卷积步长

这里用in和out表示看起来可能有一些迷惑，如果改写成下面这样的话，理解可能会更方便一些：
$n_i=\lfloor\frac{n_{i-1}+2*p_i-k_i}{s_i}\rfloor+1$
$j_i=j_{i-1}*s_i$
$r_i=r_{i-1}+(k_i-1)*j_{i-1}$
$start_i=start_{i-1}+(\frac{k-1}{2}-p)*j_{i-1}$