今年的Oral,在coco数据集表现超过了Mask RCNN,来自地平线的华科实习生。
论文:Mask Scoring R-CNN【paper】【github】
1. 提出背景
Mask RCNN 提出以来,一直是作为经典霸屏,但这里面一直存在一个严重的问题,那就是其score机制:
由于沿用了 Faster RCNN 的 class和box,对应class是类别score,并不能代表mask的好坏,看下图:
2. 算法框架
问题提出来,很简单的想法就是,我能否加一个分支预测mask部分的score呢?比如用IoU来度量。
思路很简单,在Mask head的基础上,加了一个分支,将ROI对齐后的特征与得到的Mask做了一个concat,然后通过卷积层+全连接层,得到IoU Score,最后通过score相乘得到最终的得分: