感受野

感受野

先图解一下啥是感受野在这里插入图片描述
感受野具体就是通过卷积核扫描原始图片之后一个feature map的格子代表原始图片的范围大小。
如上图,这是一个55的原始图片padding11,卷积核33,步距2。卷积扫描两次的示意图。
(2个3
3的卷积核扫描两次相当于7*7扫描一次)
计算公式
F ( i ) = ( F ( i + 1 ) − 1 ) ∗ S t r i d e + K s i z e F(i)=(F(i+1)-1)*Stride+Ksize F(i)=(F(i+1)1)Stride+Ksize
F(i):第i层感受野
Stride:第i层步距
Ksize:卷积核尺寸
拿上图举例子:
F e a t u r e   m a p : F ( 3 ) = 1 F ( 2 ) = ( F ( 2 + 1 ) − 1 ) ∗ 2 + 3 = ( 1 − 1 ) ∗ 2 + 3 = 3 F ( 1 ) = ( F ( 1 + 1 ) − 1 ) ∗ 2 + 3 = ( 3 − 1 ) ∗ 2 + 3 = 7 Feature \ map:F(3)=1\\F(2)=(F(2+1)-1)*2+3=(1-1)*2+3=3\\F(1)= (F(1+1)-1)*2+3=(3-1)*2+3=7 Feature map:F(3)=1F(2)=(F(2+1)1)2+3=(11)2+3=3F(1)=(F(1+1)1)2+3=(31)2+3=7
(感受野大小和padding无关,padding只改变总的feature map的大小并不影响feature map上一个单元映射到初始图像上的大小)
注释:事实上,计算的到的是理论上卷积的感受野,卷积的实际感受野要更小


由卷积核垛叠扩大感受野而来的作用
还是拿上面那个例子举例
33垛叠两次成为77卷积核感受野,这里是两个33步距为2合成为了77步距为4。在垛叠过程中卷积核的步距累加了(这里只是猜测没有验证,日后验证再来填坑)实际这里的7=3+2+2
原来要写的参数应该是设定卷积核为77channel,后来变为了33channel+33channel,49>18,减少了实际设定参数的个数,换句话说节省了调参的个数,加深了深度。
(这里有一个小问题要阐述,我也在这个地方怀疑了一下。常规说的二个3 * 3代替5 * 5,三个3 * 3代替7 * 7,其实意思是3*3步距为1)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值