目标检测论文分析 (一)
Cascade R-CNN
首先要知道一般的检测网络里有2个IOU阈值:
- 未开始训练时,anchor与Gt之间的IOU阈值,本文记为IOU threshold。一般我们会设置这个值为0.5,即feature map上该点的anchor与GT之间的IOU大于0.5,就讲该anchor作为训练的样本进行训练,其他的就抛弃。
- 网络进行预测的输出bbox与GT间的阈值,本文记为u。同样,一般的网络均设置u = 0.5。
开始正文:
作者用figure 1 的四幅图来说明几个问题:
(a)说明u较低时容易引入噪声,对于相似性较高的假阳样本无法做到很好的区分;
(c)说明输入IOU不同时,不同区间的输入IOU所对应的最优u 值也是不同的,比如在低质量的0.5~0.62区间,u=0.5有明显优势,而u = 0.7效果很差,而在高质量样本区间0.75以上,u = 0.7效果又占优。证明不同质量的输入样本对应的最优分类器阈值也不同。
(a)、(b)和(d)对比说明u较高时虽然过滤掉了噪声,但是整体AP会很差,原因是较高的u过滤了大量低质量样本,造成训练样本缺失,检测器对高质量的样本过拟合,而对于低质量的样