代码地址:Grid R-CNN
1. 概述
导读:Grid R-CNN将原(Faster R-CNN)中检测框偏移预估的问题转换为网格点预估问题,有了网格点的帮助,检测的性能有了进一步提升。而这篇文章提出的改进主要在原Grid R-CNN的基础上提升速度,同时也提升精度,改进之后的方法叫作Grid R-CNN Plus。其在COCO数据集上基于Res50-FPN获得了40.4%的mAP,超过前一个版本3%,同时推理的时间相差无几(相比Faster R-CNN FPN)。
2. 方法改进
2.1 Grid Point Specific Representation Region
这一部分是Grid R-CNN Plus中最显著的改进点,既是修改了grid point的特征表达,变为网格点的特定表达。由于只有正样本(IOU>0.5)才会被送入Grid branch,该branch的输出叫heatmap,维度是 56 ∗ 56 56*56 56∗56,heatmap的监督信息就如Figure2中第一行的2个图所示,分别是左上角关键点的监督信息和右中位置关键点的监督信息。
在Grid RCNN算法中,输出的heatmap和监督信息都是 56 ∗ 56 56*56 56∗