**CBNet: A Novel Composite Backbone Network Architecture for Object Detection(2019)综述

摘要:我们提出CBNet(composite backbone network),即这个网络有多个主干网络,前一个主干网络的输出特征会作为下一个主干网络的输入的一部分,以最后一个主干网络的输出作为最后的输出。提升mAP从1.5到3。以Cascade Mask R-CNN为原型,在coco实现mAP53.3,sota。

1引言
如果主干网络能够提取到更有表现力的特征,毫无疑问,后面的host检测器会表现得更好。但是设计好一个很好的主干网络并不容易,而且很多主干网络的设计最初都是为了做分类而不是做检测,所以在检测任务的表现只能是次优的。
本文提出的CBNet,其中只有一个领导主干网络(lead backbone),可以有多个协助主干网络(assistant backbone)。协助网络的某一阶段的输出作为后一个主干网络同一阶段的输入,这样这个网络的这一阶段就同时具备了多个主干网络的高层和低层特征。
本文主要贡献:
 提出一种新方法构建更powful的主干网络。
 在coco上实现最先进的性能mAP53.3。

2、 相关工作
目标检测:。。。仍有性能提升的空间
目标检测的主干网络:。。。新提出的主干网络都需要在ImageNet上做预训练。
循环卷积神经网络(Recurrent Convolution Neural Network):如下图,CBNet看起来有点像RCNN,实际差得远,而且RCNN需要预训练。
在这里插入图片描述

3 所提出的方法
3.1 CBNet架构
K个主干网络,领导主干网络Bk,其他协助主干网络B1…Bk-1.
如上有多,中间红线连接用了1*1卷积和bn来降维。
3.2其他的融合方式
在这里插入图片描述
本文用的是AHLC。
同层融合SLC(same level compositon):如上b。
邻近低层融合ALLC:与CBNet思想正好相反,不是由高层融到低层,而是由低层融到高层。如上c
密集高层融合DHLC:如上d。与DenseNet思想类似,每一层都融到后一主干网络的所有低层。
3.3CBNet检测网络的架构

4 实验
在coco上实验
4.1实现细节
单个gpu的上图片由原来的2张减为1,学习率减半。其他不变。
4.2检测结果
在FPN,Mask R-CNN, Cascade R_CNN上做实验。
在这里插入图片描述
4.3不同融合方式的比较

SLC同层融合效果比原始的单主干还差,推断是由于带来了更多的参数冗余。
ALLC低层向高层融合:效果SLC还差,推断是由于低层的特征扰乱了高层的语义特征。
DHLC密集高层融合(即下表中的ADLC,可能是作者的错误):并不能地带来像AHLC一样好的效果,可能是只有邻近的高层特征才能对下一级主干网络进行增强,太远了没用。
在这里插入图片描述
4.4.CBNet的共享权重
证明性能的提升主要是来自于更好的结构设计,而不是更多的网络参数。
在这里插入图片描述
4.5 CBNet中主干网络的数量的影响
主干网络数量越多,性能越好,但是3之后,性能增长不明显。
在这里插入图片描述
4.6 CBNet的加速版本
由于主干网络有两个(FPN),速度由单个主干网络的8.1FPS降到5.5FPS。故提出一个加速版本,即前几层公用一个主干网络,到后面才产生分支进行融合。如下左图。
4.7通过CBNet进行基础特征增强的有效性
推断性能比单个主干网络更好的原因:能够提取更有表现力的基础特征。如下右图。
在这里插入图片描述

5 结论

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值