[论文解读]ECCV2018|PFP-Net:Parallel Feature Pyramid Network for Object Detection

题目:Parallel Feature Pyramid Network for Object Detection
作者:Seung-Wook Kim, Hyong-Keun Kook, Jee-Young Sun,Mun-Cheon Kang, and Sung-Jea Ko

Motivation:
作者认为像金字塔形式的Feature map的网络,限制了网络的表现,尤其对于小目标的检测。对此,作者提出PFPNET。如图d所示。
在这里插入图片描述

Related Works:

先直接上PFPNET网络结构图:

在这里插入图片描述base network:预训练去掉全连接层的VGG16。
Bottleneck layer: conv1x1+batch norm +relu
FP pool: 就一般的池化
MSCA: F H 与 F L F_H与F_L FHFL的特征图组合在一起,并再将大特征图downsamping, 小特征图upsamping,到同一尺度,再concatenate.其中, F H F_H FH有D个channels, F L 有 ( N − 1 ) × D / ( N − 1 ) = D F_L有(N-1)×D/(N-1)=D FLN1×D/N1=D(作者的目的就是凑成D)个channels,各占一半。此外,作者也做过去掉 F H F_H FH,全由 F L F_L FL组成Feature map的实验,但表现与预期一样不好。

在这里插入图片描述
details: 采用RfineDet的ARM方式来做Anchors.

PFPNET:
1)图像经过VGG16的base network后,产生WXHXD的Feature map
2) 再经SPP池化成N(图中为3)个high dimensional 的特征图 ( F H ) s i z e = W 2 n × H 2 n (F_H) size =\frac{W}{2^n} × \frac{H}{2^n} FH)size=2nW×2nHN:pyramid levels.
3)经过Bottleneck layer ( H L n ) (H_L^n) (HLn),得到 ( F L ) c h a n n e l = D / ( N − 1 ) (F_L)channel=D/(N-1) (FL)channel=D/(N1
4)经MSCA,得到 P L P_L PL;
5)最后采用RefineDet的方法进行训练(可以参考我的別一篇博客RefineDet)。

Experiment:
作者对N和C的值,做了对比:
在这里插入图片描述
也对ARM做对比,感觉很大程度是ARM的功劳。
在这里插入图片描述
VOC2007与2012的对比
在这里插入图片描述从这也可以看出,在RefineDet的基础上有0.1-0.4的增点。
在这里插入图片描述在COCO上,作者相对于RefineDet也有涨点,但没有做resnet101的对比。

在这里插入图片描述
在速度上就有了明显的优势。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值