写在前面:
文章的Relation Work概述了目标检测种经典的Two-Stage Approach and One-Stage Approach。我一直并没有对读过的论文进行梳理,这篇文章使得自己对目标检测算法的现状更加清晰了。
总结Two-Stage Approach 的优点和缺点:
优点(1)using two-stage structure with sample heuristics to handle class imbalance;
优点(2)using two-step cascade ti regress the object box parameters;
优点(3)using two-step features to describe the object
缺点(1)慢
总结One-Stage Approach 的优点和缺点:
优点(1):快
缺点(1):类别不平衡问题很严重,导致准确度较低
Two-Stage Approach 使用RPN提取proposal,使得其拥有优点1/2/3, 同时产生缺点1;
One-Stage Approach使用密集的default anchor提取候选,引入缺点(1)
于是作者就想要搞出一个东西来拥有Two-Stage Approach优点1/2/3和One-Stage Approach优点1。(谁不想啊!!!)
创新点
anchor refinement module:
(1) 类似RPN的功能: filter out negative anchor, reduce search space for classifier
(2) coarsely adjust the locations and size of anchors to provide better initialization for subsequent regress
通过增加Anchor Binary Classification an Regression 任务实现anchor refinement module。即:
(a)先对default anchor 进行初步筛选,判断它是前景还是背景—2分类,是背景的概率比较大于0.99则其是一个容易的negative sample,舍弃掉。这样以来负样本数量减少了质量提高了,样本不均衡问题也减弱了;
(b)微调default anchor的位置和大小(regression),使得后续的位置预测变得简单了。
Transfer Connection Block:
深层特征和浅层特征融合,没啥新的。
Object detection Module:
类似SSD multibox detection。
多层级特征做 bbox 回归和class-label分类
使用anchor refinement module 筛选过的anchor 而不是default anchor
Loss
Anchor Refinement Module 的 2-classifier loss, regression loss
Object detection Module 的 multi-classifier loss,regression loss