Paper:
Erhan, D., Szegedy, C., Toshev, A., & Anguelov, D. (2014).
Scalable Object Detection using Deep Neural Networks
. CVPR.
Goal
将基于DNN 的物体检测方法扩展到大规模数据集上。
Contribution
- 将物体检测问题定义为输出为多个bounding box 的回归问题。每个bounding box 同时输出坐标和置信度,使得模型更加紧凑和高效。
- 利用DNN 同时学习数据的表示和bounding box 检测器。
- 在无类别监督的条件下训练box 检测器,使得该方法的计算复杂度几乎不受物体类别的影响,因此适合于大规模物体检测问题。该方法还可以推广到未知的类别。
DPM 的问题:
- Sliding windows 需要在多个尺度上进行穷尽搜索,时间代价高。Branch-and-bound
[1]
策略避免了这个问题。 - 检测时间和类别数目成线性关系,不利于大规模检测问题。使用低维共享的基
[2]
和哈希方法