论文阅读:(AAAI 2019)M2det: A single-shot object detector based on multi-level feature pyramid network

大的背景
  • 特征金字塔网络似乎已经成为了相关目标检测比赛的一些标配,而且不论是one-stage(DSSD, RetinaNet),还是two-stages(Mask RCNN)
  • 但是这个也并不是无往不利的利器,它也有着它的缺陷:
    • 金字塔中提取的feature map往往没有足够的特征表达能力,因为这些feature map只是简单的根据主干网络的结构构成,但是这些主干网络起初是为目标识别而设计的。
    • 用来检测物体的每一个feature map,往往主要是single-level layers构成,这也导致了只能包含single-level信息。
论文中主要工作做了什么?
  • 基于SSD,设计了Multi-Level Feature Pyramid Network(MLFPN),具体来讲,提出了3个模块层
    • FFM(Feature Fusion Module)(FFMv1, FFMv2)
    • TUMs(Thinned U-shape Modules)
    • SFAM(Scale-wise Feature Aggregation Module)
  • 这篇论文有个特点,就是写的特别清楚,基本上看它的方法图,就能看懂做了什么,通俗易懂
    • 整体框架图:
      在这里插入图片描述
    • FFMv1和FFMv2
      在这里插入图片描述
    • TUMs:
      在这里插入图片描述
    • SFAM:
      在这里插入图片描述
  • 直观感受一下,和其他金字塔的区别:
    在这里插入图片描述
相比于FPN,有什么优点呢?

从最后作为预测特征前的feature map而言,相比于FPN, MLFPN中的decoder layer比backbone更深,这样可以解决前期提取特征表达能力不足,也可以解决single-level的问题。

相关的资源:
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值