CBNet:一种新的组合主干网络结构,用于物体检测

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”


作者:Tony Shin

编译:ronghuaiyang

导读

对CBNet进行了一个直观的介绍。

https://towardsdatascience.com/cbnet-a-novel-composite-backbone-network-architecture-for-object-detection-review-ec98e8b7bc9b

论文:https://arxiv.org/pdf/1909.03625.pdf

代码:https://github.com/PKUbahuangliuhe/CBNet

CBNet在COCO测试数据集上的平均精度为53.3。

作者声称,使用一个更强大的主干可以提高目标检测器的性能。为了做到这一点,他们提出了一种新的策略,即通过相邻主干之间的组合连接来组装多个相同的主干。通过这样做,他们提出了一个更强大的主干,称为组合主干网络。

如上图所示,CBNet由多个相同的骨干网和相邻骨干网之间的组合连接组成。从左到右,每个阶段的输出都在一个辅助主干中,这也可以看作是更高层次的特征。每个特征层的输出通过组合连接流到后续主干网的并行阶段,作为输入的一部分。这样,多个高级和低级特征被融合,以产生更丰富的特征表示。

本文介绍了双主干网(DB)三主干网(TB)两种体系结构。从命名中可以猜到,DB由两个相同的骨干组成,而TB由三个相同的骨干组成。性能差异将在后面的文章中讨论。

为了从主干中生成多个输出,本文引入了一个组合连接块。这个块由一个1x1卷积和一个批处理归一化层组成。添加这些层是为了减少通道的数量并执行一个upsample操作。

最后的主干(位于图中最右边),被命名为主主干,用于目标检测。前面的骨干的输出特征被送入RPN/检测头,而每个辅助骨干的输出被送入相邻的骨干。

组合的形式

还有四种组合样式。

  • 相邻的更高层次的组合是前面部分中解释的风格。使用组合连接块将来自辅助骨干网的每个输出特征馈入相邻骨干网。

  • 相同层次的组合是另一种简单的组合样式,它将前一骨干的相邻较低级阶段的输出提供给后续骨干。如图所示,此样式没有使用组合连接块。来自较低层次主干网的特征直接添加到邻近的主干网中。

  • 相邻的低层的组合与AHLC非常相似。唯一的区别是来自前主干较低级阶段的特征被传递到后来的主干。

  • 密集的高层的组合的灵感来自于DenseNet的paper,其中每一层都与随后的所有层连接,在一个stage上建立密集的连接。

上面的表格展示了不同组合风格之间的对比。我们可以观察到AHLC样式优于其他复合样式。这背后的原因在论文中得到了很好的解释。作者认为,将前一个主干的低层特征直接添加到后续主干的高层特征中会损害后一个特征的语义信息。另一方面,在后续主干的浅层特征基础上增加前一主干的深层特征,可以增强后一主干特征的语义信息。

结果

上表显示了MS-COCO测试数据集的检测结果。第5-7列为目标检测结果,第8-10列为实例分割结果。这清楚地表明,利用更多的骨干的体系结构提高了网络的性能。

总结

本文介绍了一种叫做CBNet的新架构。通过组成多骨干体系结构,该网络将检测网络的准确率提高约1.5%至3%。增加的参数大小和训练时间值得进一步研究。

—END—

英文原文:https://towardsdatascience.com/cbnet-a-novel-composite-backbone-network-architecture-for-object-detection-review-ec98e8b7bc9b

请长按或扫描二维码关注本公众号

喜欢的话,请给我个在看吧

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值