Cascade RCNN是在RCNN的two-stage结构的基础上提出的mulit-stage结构的网络。在RCNN网路的ROIHead阶段,为了训练网络需要确定输入ROIHead网络的预选框(proposal)是背景还是前景,传统的做法是计算预选框和真实边框的IOU,与真实边框的IOU大于0.5的预选框为前景(正样本),小于0.5的为背景(负样本)。但是Cascade RCNN的作者提出仅仅使用一个IOU阈值为0.5得到的是低质量的检测器,有两个原因
1)IOU的阈值为0.5会导致很多低质量预选框被作为正样本进入训练。
2)训练阶段可以设置IOU阈值对预选框进行采样,但是在推理阶段,因为没有真实边框,所以会把所有的预选框都作为正样本框输入进行推理,训练阶段输入的正样本框的质量要高于推理阶段输入的样本框的质量,这就是论文里提到的mismatch问题。
那么我们是否可以直接增大IOU的阈值呢,论文作者分析,仅仅通过提升IOU阈值又会有下面两个问题
1、增大阈值后得到的正样本数量会减少,出现过拟合。
2、训练阶段和推理阶段会出现更严重的mismatch的问题。
针对上述问题ÿ