CVPR论文阅读笔记:《D2Det: Towards High Quality Object Detection and Instance Segmentation》
创新点
1、提出一种新的 Two-stage 检测方法——D2Det;
2、引入稠密局部回归(dense local regression),并通过二值重叠预测策略(binary overlap prediction strategy)进一步将其改进。解决了精确定位问题;
3、引入一种判别型 Rol pooling 方案,解决了精准分类的问题。
摘要撰写
1、提出了什么方法;
2、陈列并简述方法的创新点,不给予扩展;
3、说明数据集出处➡将新方法与就方法对比➡摆出实验数据➡套话结束。
1 我们的方法(第三部分)
给出总体框架,有逻辑性的陈述理论工作
新方法的原型是 Faster R-CNN,与 Faster R-CNN 不同的是:
- 采用独立的分类与回归方案;
- 用稠密局部回归代替 Faster R-CNN 的框偏置回归(精确定位目标);
- 用discriminative Rol pooling改进proposal方案的分类(精确分类目标)。
1.1 稠密局部回归
稠密局部回归方法将k×k维的 RoI 特征视为k^2个空间相邻的局部特征其中一个局部特征(我的想法是对k×k个像素点都有对应的一个局部特征,而且这个k×k的框就是经过RPN的,所以背景占比极少,大部分pi都能进行微调)。对应下图的右下角到右上角
但是,局部特征的数量取决于 candidate proposal P 和 G 的重合度,但是即使重合度高的时候,也会有非目标特征(例如背景特征)出现在这 k^2个局部特征中。
为了避免这个情况,运用二元重叠预测来对每个局部特征进行分类: