论文阅读: Light-head R-CNN

Introduction

Head ” 在文中指连接在basemodel后面的网络结构,包括以下两部分:

  • RoI warping
  • RoI-wise subnet

Faster R-CNN和R-FCN速度都不够快,原因在于它俩的head都太heavy了。

Faster R-CNN heavy在它的RoI-wise subnet部分,因为这部分需要重复计算:
这里写图片描述

R-FCN则heavy在它的RoI warping部分,因为这部分score map设计得太厚了(厚度为 k2(C+1) k 2 ( C + 1 ) ,在COCO版本的代码中channel达到了3969):
这里写图片描述

论文指出,正是因为heavy-head,导致了inference speed一直是two-stage之殇。

two-stage系需要有一个算法站出来,在speed和accuracy上双双打败one-stage。

这个时候,Li Zeming大神提出了解决办法:

thin feature map + cheap RoI-wise subnet = Light-head

以Light-head作为头部的检测算法,就叫Light-head R-CNN。
其对应的网络结构如下:
这里写图片描述

Note

  • R-FCN中对于每个proposal,是一个类回归一个4-d vector来表征location信息,所以每个proposal对应C个locaton vector(背景proposal则没有location vector);到了Light-head R-CNN中,则是一个proposal,只对应一个location vector。
  • 将score map的channel 从3969(COCO version)降到了490。

lizeming大神在论文中提出了基于两种basemodel的版本。其中一种基于类Xception,称之为S型Light-head R-CNN,其网络结构如下:
这里写图片描述

另外一种基于ResNet,称之为L型Light-head R-CNN

Innovation

thin feature map + cheap R-CNN subnet = Light-head

Result

不管在哪一种basemodel下,Light-head R-CNN在检测算法之林都是一骑绝尘:
这里写图片描述

其中,Light-head R-CNN的检测性能用红色三角形表示,所采用的三种basemodel分别为Xception、ResNet-50和ResNet-101。可以明显看出,Xception为basemodel时,速度极快,但是AP值会掉非常多。

在COCO数据集上,Light-head R-CNN击败了其他所有算法,包括Faster R-CNN、Mask R-CNN和RetinaNet:
这里写图片描述

inference speed居然可以吊打one-stage系,包括SSD、YOLOv2。这边并没有列出RetinaNet,估计还是无法超越RetinaNet:
这里写图片描述

最后贴上两张效果图:

  • L型Light-head R-CNN效果图:
    这里写图片描述

  • S型Light-head R-CNN效果图:
    这里写图片描述

Thinking

  • Light-head R-CNN的故事讲得并不好。全文就一直在说自己的东西多么多么powerful,但是却缺乏理论依据,净拿数据说事。由于多少看起来有点“空手套白狼”的感觉,所以投CVPR被拒。

  • 文中的thin feature map很反直觉。这么剧烈地压缩模型,性能居然不降反升,很令人诧异。但是作者却没有给出合理的解释,reviewer对此持怀疑态度也是可以理解的。

  • 但其实Light-head是真的管用。tensorflow版的Light-head R-CNN作者已经开源:zengarden/light_head_rcnn,大家可以去clone下来研究研究。


[1] Light-Head R-CNN: In Defense of Two-Stage Object Detector

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值