Introduction
R-FCN-3000的定位是 large-scale detector 。
large-scale detector | 核心技术 | 精度 | 意义 |
---|---|---|---|
YOLO-9000 | 语法树 | 较差 | 第一个large-scale detector |
R-FCN-3000 | 解耦“定位”和“分类” | 较好 | 第一个可实用的large-scale detector |
分类
采用了YOLO-9000中的分类思想:
大类得分 × 细类得分 = 最终分类得分
定位回归
将“定位”和“分类”解耦,避免了R-FCN中对每个类都进行一次bbox回归:
设计了双pipeline结构如下:
Innovation
经过一系列实验,发现:
- “按类进行回归”是没有必要的,去掉之后甚至可以获得一个更合理的object得分;
- 因为很多object类之间的外观高度相似,共享“定位卷积计算”是可行的。
Result
R-FCN-3000效果图如下:
Thinking
这篇文章我只是略读。觉得作者洞察得很仔细,设计的网络结构也较简单,而且最终的检测精度和检测速度都不错。
[1] R-FCN-3000 at 30fps: Decoupling Detection and Classification