EfficientDet论文阅读补充笔记

一、摘要

1.提出了一个基于加权的双向特征金字塔网络(BiFPN)允许简单快速的进行多尺度特征融合。
2.提出了一种复合尺度扩张方法,该方法可以统一地对所有的Backbone网络,特征网络和预测网络的分辨率,深度和宽度进行缩放。

二、 Introduction

能否在有效资源限制范围内,构建高效率高精度的网络?(两个挑战)
1.高效的多尺度特征融合
2.模型缩放

三、 BiFPN

1.多尺度特征融合问题

a.FPN:自上而下(top-down)结合多尺度特征的方法(P3-P7)

FPN
在这里插入图片描述
Resize通常是上采样或下采样操作。
缺点:本质上受到单向信息流的限制。

b.PANet:在FPN之上增加了一个额外的自下而上的路径聚合网络

在这里插入图片描述
PANet比FPN和NAS-FPN获得了更好的精度,但代价是更多的参数和计算。

c.STDL:提出跨尺度特征的尺度转换模块
d.M2det:提出了一种多尺度融合特征的U行模块
e.NAS-FPN:使用神经架构搜索来找到不规则的特征网络拓扑,然后重复应用相同的块。(无规则)

在这里插入图片描述

f.BiFPN:

在这里插入图片描述
构造过程
1.删除那些只有一条输入边的节点。
原因:如果一个节点只有一条输入边而没有特征融合,那么它对旨在融合不同特征的特征网络的贡献就很小。
2.在同一水平的节点,在原始输入到输出节点间添加额外的边。
原因:这样在不增加太多成本的情况下能融合更多的特征。
3.把top-down和bottom-up固定成一个特征网络层,并且重复多次。
原因:实现更高级别的要素融合。

2.加权特征融合

不同的输入特征具有不同的分辨率,它们通常对输出特征的贡献是不相等的。为了解决这个问题,建议为每个输入增加一个额外的权重,并让网络了解每个输入特征的重要性。(很熟悉。不再展开)

四、EfficientDet

1.对于backbone网络

直接采用EfficientNet-B0 to B6中的复合系数,并采用 EfficientNet作为backbone。

2.对于BiFPN网络

depth&&width
对于BiFPN network中width和depth的设置:
深度(#layers):线性增长
宽度(#channel):指数增长
ϕ \phi ϕ:Pick the best value 1.35 as the BiFPN scaling factor.

3.对于Box/Class预测网络

在这里插入图片描述
对Box/class prediction network中的depth的设置。

4.对于输入图像分辨率

在这里插入图片描述
对于Input image resolution的设置(必须是27的倍数)

5.详细的复合系数设置

在这里插入图片描述

五、实验结果

1.在COCO数据集上和其他流行的检测网络的详细对比结果

在这里插入图片描述

2.模型大小和推理延迟

在这里插入图片描述

3.不同特征融合方式的对比实验结果

在这里插入图片描述

4.不同缩放方式的比较结果

在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值