级联R-CNN出现原因
论文链接:https://arxiv.org/abs/1712.00726
上文针对目标检测中IOU阈值选取问题。一味增大阈值,使得样本减少。容易导致过拟合。且train和inference阶段的阈值不同导致更严重的mismatch.
回顾faster R-CNN:
train阶段:将整张图片喂入conv-relu-pooling得到整各特征图,再RPN选取2000个proposals,通过softmax判断锚点(anchors (目标框))判断是否为前景(是否有物体),边界框回归筛选精确proposals,proposals(128个)被送入到Roi Pooling,提取目标区域的特征图,最后进行类别分类和box回归(判断是什么物体)
softmax 一次性分类多个物体。等价于多个SVM
inference阶段:RPN选取300左右proposals,送入fast R-CNN,和train阶段不同的是:无法确定gt,导致无法筛选proposals,全部送入Roi-Pooling
IoU:指真实框和预测框的关联度。由proposal和gt确定IOU。
inference:指test阶段或者predict阶段。
mismatch :training阶段的输入proposals质量更高(被采样过,IoU>threshold),inference阶段的输入proposals质量相对较差.导致