Cascade R-CNN:Delving into HIgh Quality Object Detection

本篇是2018CVPR收录的关于物体检测的文章,作者仔细分析目前物体检测框架中Iou阈值的选取对于物体定位精度和整体训练的影响。

Iou阈值直接影响训练阶段正负样本的划分,threshold太高,如0.7,正样本的质量越高,但是正样本的数量会急剧减少,加剧正负样本的不平衡,训练容易过拟合;threshold太低,如0.5,正样本的数量会增加,但是正样本的质量下降,容易产生false positive。具体影响如下图所示:

(c)图横轴是输入的proposal的IoU,纵轴是经过bbox reg之后的bbox和ground-truth的IoU。可以看到,低IoU threshold对于低IoU的样本有更好的改善,但是对于高IoU的样本就不如高threshold的有用,即一个固定的IoU阈值只能对同等大小的输入IoU回归效果明显。原因在于不同threshold下样本的分布会不一致,也就导致同一个threshold很难对所有样本都有效。(d)图则表明网络的的检测效果并不随Iou阈值的变化单调地变化。

但是通过(c)图可以发现,选取不同阈值,回归过后的Iou基本上都能有所上升。因此作者提出的级联式的框架,将上一步inference得到的bbox采用更高的Iou阈值在进行训练。如下图(d)所示:

(d)展示的就是本文Cascade R-CNN的基本框架;(a)就是经典的Faster R-CNN框架,也是本文的baseline;(b)结构上和Cascade R-CNN非常相似,区别在于只在测试时采用级联结构对Box多次回归,因此ROI检测网络部分“H1”结构是相同的,也即训练时还是采用的单一的IoU阈值;(c)则是在ROI检测网络部分并联多个检测器,并没有对位置进行迭代更新。

最终作者选用的级联结构共有4个stages, IoU阈值分别设定为递进的0.5/0.6/0.7,大于该阈值的选为正样本,其余均为负样本,进行训练。并实验证明了过多的stage是没必要的,其中第2个stage的提升最为明显。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值