Google Research
开源code/model地址:https://github.com/tensorflow/models/tree/master/object_detection
0.abstract
本文主要对主流的三类object detector进行了speed-accuracy trade-off上的比较。
作者考虑三类”meta-architectures”:faster rcnn 、r-fcn以及ssd
faster rcnn和r-fcn是region-based detector,不同的是,faste rcnn里面box classifier用的是强分类器,而r-fcn里面的box classifier相对可以看成弱分类器的组合。
ssd(这里包括了yolo等)是region-free detector
作者主要探讨了不同的feature extractor、image resolution、以及对于faster rcnn和r-fcn来说,number of proposals对检测器性能(精度、速度、内存使用)的影响
1.Motivation & contribution
目前主流的目标检测框架缺乏相互之间各方面的对比,因此作者在tensorflow上将各个主流的检测算法都实现了一遍,用来对比不同检测算法,当然这里对比的都是各个算法的single model,也就是说不使用ensemble。
作者主要的两点发现是: