CBNetV2: A Composite Backbone Network Architecture for Object Detection论文阅读

paper:https://arxiv.org/pdf/2107.00420v2.pdf
code:https://github.com/VDIGPKU/CBNetV2

介绍

性能强大的检测器往往需要强大的backbone,而比较常见的增强backbone的方法就是将其变得更深、更宽,或者设计更强大的backbone,且需要在imagenet等数据集上预训练,会有昂贵的预训练成本;当然也可以不使用预训练权重,直接从头开始训练检测器,但这会需要更多的计算资源和训练技巧;

论文提出了一种有效率的方法来融合现有的pre-trained权重作为一个检测器的backbone,不像其他致力于精心制作模块并且需要在ImageNet上预训练来加强模型的表达能力,CBNetv2通过一种新的融合方法直接提升现有的pre-trained模型表达能力,不需要预训练;

如图1所示,并行的backbone(assisting backbone,lead backbone)通过“融合连接”连接到一起;assisting backbone的每个stages的输出流到其后续backbone的并行级stage和较低级别stage;
在这里插入图片描述
与简单的网络深化或扩宽不同,CBNetV2融合了多个骨干网络的高、低层特性,并逐渐扩展接收域,以更有效地进行目标检测。值得一提的是CBNetV2不需要为检测器预训练任何模型,只需要使用现有开源pretrained单个backbone的权重来初始化CBNetV2的每个组装backbone;

CBNetV2适用于one-stage, two-stage, anchor-based, anchor-free等检测方法,并且在Faster R-CNN, Mask R-CNN, Cascade R-CNN,Cascade Mask R-CNN,ATSS等方法上均有超过3%的精度提升;

并且CBNetV2方法比那些将网络加深,加宽带来的提升更多,且更有效率,例如Dual-ResNeXt50-32x4d比ResNeXt101-64x4d作为backbone带来了0.7%的AP提升,但只有其70%的参数;
Dual-Swin-T比 Swin-B有更少的参数和FLOPs,并有1.7%的AP提升;
HTC Dual-Swin-B在COCOtest-dev上实现了58.6%的box AP和51.1%的mask AP,在多尺度测试下实现了59.3%的box AP和51.8%的mask AP

论文的主要贡献:

  1. 使用现有的pretrained模型权重建立了一个更强大的backbone CBNetV2,不需要额外预训练;
  2. CBNetV2使用更有效率和更友好的方式来融合较大的backbones,而不是简单的增加网络宽度、深度并在ImageNet上预训练;
  • 2
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
CFNet是一个插拔式的目标检测的主干网络,它能够有效地处理目标检测任务。目标检测是计算机视觉领域中的一个重要任务,它涉及到从图像或视频中识别和定位不同物体的能力。 CFNet的设计理念是将主干网络设计成一个可插拔的组件,使得研究者和开发者可以根据自己的需求和具体任务进行定制。这种设计的好处是,它不仅能够提供高效的目标检测性能,而且可以灵活地适应各种不同的应用场景。例如,当需要进行实时的目标检测时,可以使用轻量级的CFNet进行快速推理;当需要进行高精度的目标检测时,可以选择更加复杂的CFNet进行训练和推理。 CFNet采用了一种特殊的架构来实现目标检测。它结合了多尺度特征图的信息,并使用了一种称为Anchor的机制来生成候选框。然后,它通过分类和回归分支来对候选框进行检测和定位。这种设计可以有效地提高目标检测的准确性和效率。 CFNet还具有良好的可扩展性和泛化能力。它可以在不同的数据集上进行训练,并且可以通过微调等方法进一步提高性能。此外,CFNet还支持一些常见的目标检测任务,如目标跟踪和实例分割。 综上所述,CFNet是一个插拔式的目标检测主干网络,它通过灵活的设计和架构来实现高效准确的目标检测任务。它在计算机视觉领域具有广泛的应用前景,可以用于各种不同的目标检测任务。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值