学习笔记十三——R-FCN

本文深入探讨了R-FCN(Region-based Fully Convolutional Networks)在目标检测中的应用。针对传统网络结构中目标检测精度与运行速度的矛盾,R-FCN引入位置敏感的分数图和RoI池化层,通过全卷积网络实现高效检测。论文以ResNet-101为基础,去除全连接层,利用1×1卷积降低维度,并将RoI划分为k×k网格,为每个类别生成分数图。R-FCN的损失函数结合分类和回归任务,实现在保持高精度的同时提高运行效率。
摘要由CSDN通过智能技术生成

论文R-FCN:Object Detection via Region-based Fully Convolutional Networks学习总结

提出问题:在使用AlexNet和VGG Nets网络时,由于其在设计上由两个子网络组成:一个卷积子网络以空间池化层结束,后面是几个全连接层。因此,在目标检测网络中自然地通过感兴趣区域RoI池化层进行划分,划分为两个子网络:(1)独立于RoI的共享“全卷积”子网络,(2)不共享计算的RoI子网络。

但是随着神经网络的发展,提出了ResNet和GoogLeNets是全卷积的。因此类比提出在目标检测架构中使用所有卷积层来构建共享的卷积子网络,使得RoI的子网络没有隐藏层。然而,这个解决方案检测精度很差。

作者提出这种不平衡是由于增加图像分类的变换不变性与目标检测的平移可变性而导致的困境。

解决方法:为了将平移可变性并入FCN,我们通过使用一组专门的卷积层作为FCN输出来构建一组位置敏感的分数图。在这个FCN之上,我们添加了一个位置敏感的RoI池化层,它从这些分数图中获取信息,并且后面没有权重(卷积/fc)层。

R-FCN详解:

主干结构:基于ResNet-101,删除最后的平均池化层和全连接层,保留前100卷积层,只使用卷积层来计算特征映射

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值