【深度学习】感受野

感受野是卷积神经网络每一层输出的特征图(Feature Map)上的像素点在原始图像上映射的区域大小。
在这里插入图片描述
卷积神经网络由输入维度计算输出维度:

output size = ( input size - kernel size + 2 * padding ) / stride + 1 

卷积神经网络由输出维度计算输入维度:

input size = (output size - 1* stride - 2 * padding + kernel size

计算感受野大小时,忽略了图像边缘的影响,即不考虑padding的大小

先计算最深层在前一层上的感受野,然后逐渐传递到第一层,使用的公式

可以表示如下:

待 计 算 的 f e a t u r e m a p 上 的 感 受 野 大 小 : R F n = 1 待计算的feature map上的感受野大小:RF_{n}=1 featuremap:RFn=1 R F i = ( R F i + 1 − 1 ) ∗ S i + K i RF_{i}=(RF_{i+1}-1)*S_{i}+K_{i} RFi=(RFi+11)Si+Ki

S 表示卷积的步长; K表示卷积层滤波器的大小

AlexNet为例:
在这里插入图片描述
计算conv_5的感受野:
在这里插入图片描述
扩大感受野,主要是通过池化和大步长卷积,卷积层对扩大感受野作用很小

python实现

#Python
#卷积层输出大小和感受野大小的计算
net_struct = {'alexnet': {'net':[[11,4,0],[3,2,0],[5,1,2],[3,2,0],[3,1,1],[3,1,1],[3,1,1],[3,2,0]],
                   'name':['conv1','pool1','conv2','pool2','conv3','conv4','conv5','pool5']},
       'vgg16': {'net':[[3,1,1],[3,1,1],[2,2,0],[3,1,1],[3,1,1],[2,2,0],[3,1,1],[3,1,1],[3,1,1],
                        [2,2,0],[3,1,1],[3,1,1],[3,1,1],[2,2,0],[3,1,1],[3,1,1],[3,1,1],[2,2,0]],
                 'name':['conv1_1','conv1_2','pool1','conv2_1','conv2_2','pool2','conv3_1','conv3_2',
                         'conv3_3', 'pool3','conv4_1','conv4_2','conv4_3','pool4','conv5_1','conv5_2','conv5_3','pool5']},
       'zf-5':{'net': [[7,2,3],[3,2,1],[5,2,2],[3,2,1],[3,1,1],[3,1,1],[3,1,1]],
               'name': ['conv1','pool1','conv2','pool2','conv3','conv4','conv5']}}

imsize = 224

def outFromIn(isz, net, layernum):#从前向后算输出维度
    totstride = 1
    insize = isz
    for layer in range(layernum):
        fsize, stride, pad = net[layer]
        outsize = (insize - fsize + 2*pad) / stride + 1
        insize = outsize
        totstride = totstride * stride
    return outsize, totstride

def inFromOut(net, layernum):#从后向前算感受野 返回该层元素在原始图片中的感受野
    RF = 1
    for layer in reversed(range(layernum)):
        fsize, stride, pad = net[layer]
        RF = ((RF -1)* stride) + fsize #计算感受野大小时,忽略了图像边缘的影响,即不考虑padding的大小
    return RF


if __name__ == '__main__':
    print "layer output sizes given image = %dx%d" % (imsize, imsize)
    for net in net_struct.keys():
        print '************net structrue name is %s**************'% net
        for i in range(len(net_struct[net]['net'])):
            p = outFromIn(imsize,net_struct[net]['net'], i+1)
            rf = inFromOut(net_struct[net]['net'], i+1)
            print "Layer Name = %s, Output size = %3d, Stride = % 3d, RF size = %3d" % (net_struct[net]['name'][i], p[0], p[1], rf)

参考:
https://zhuanlan.zhihu.com/p/24833574
http://lanbing510.info/2017/08/24/RCNN-FastRCNN-FasterRCNN.html

附另一种计算方法:
https://zhuanlan.zhihu.com/p/28492837

https://zhuanlan.zhihu.com/p/44106492

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值