Abstract:
目标检测领域,IoU 被用来定义 positives 和 negatives,当一个detector使用 0.5的IoU时,会产生nosiy detections,但是当提高IoU时,检测的表现又会变差。造成变差的主要原因有两点,一是训练时因为positive samples 的减少而造成的overfitting,另一个是inference时的IoU和训练时IoU的不匹配问题。Cascade RCNN可以解决以上两个问题,通过逐步提高IoU的级联detectors来克服假阳性的例子。证明了一个detector的输出分布对训练更高质量的detector是有益的。因为inference 和训练过程使用相同的级联结构, 所以在每一个stage有一个比较好的match。
Introduction:
目标检测需要解决两个问题,一个是recognition,一个是localization。这两种问题都十分困难,因为detector要处理很多close false positives(close but not correct)。在 two-stage 的 R-CNN的detector中需要使用IoU来定义 positives/negatives,通常情况下会使用 0.5 的值,这样会放松对正例的限制,产生很多nosigy bounding box,detector将不会很好的分辨出假阳性例子。
基于单个detector只会对单个quality level 是最优的知识,来进行高精度检测任务的优化。
我们定义了一个IoU质量,如下图所示: