物体检测中的单步模型(one-stage)和两步模型(two-stage)

物体检测模型大致可以分为单步(one-stage)和两步(two-stage)模型两大类。

 

单步模型:指没有独立地、显示地提取候选区域(region proposal),直接由输入图像得到其中存在的物体的类别和位置信息的模型。(在计算效率上有优势

典型的单步模型有:OverFeat、SSD(Single Shot multibox-Detector )、YOLO(You Only Look Once)等

 

两步模型:有独立的,显示的候选区域提取过程,即先在输入图像上筛选出一些可能存在物体的候选区域,然后针对每个候选区域,判断其是否存在物体,如果存在,就给出物体的类别和位置修正信息。(在检测精度上有优势

典型的两步模型有:R-CNN、SPPNet、Fast R-CNN、Faster R-CNN、R-FCN、Mask R-CNN等。

 

 

(1)多数单步模型是利用预设的锚框(Anchor Box)来捕获可能存在于图像中各个位置的物体。因此,单步模型会对数量庞大的锚框进行是否含有物体及物体所属类别的密集分类。由于一幅图像中实际含有的物体数目远小于锚框的数目,因而在训练这个分类器的时候,正负样本数目是极不均衡的,这会导致分类器训练效果不佳。RetinaNet通过Focal Loss来抑制负样本对最终损失的共献以提升网络的整体表现。在两步模型中,由于含有独立的候选区域提取步骤,第一步就可以筛选掉大部分不含有待检测物体的区域(负样本),在传递给第二步进行分类和候选框位置/大小修正时,正负样本的比例已经比较均衡,不存在类似的问题。

 

(2)两步模型在候选区域提取的过程会对候选框的位置和大小进行修正,因此进入第二步前,候选区域的特征已对齐,有利于为第二步的分类提供质量更高的特征。两步模型在第二步候选框会被再次修正,因此一共修正了两次候选框,这带来了更高的定位精度,但同时也增加了模型复杂度。单步模型没有候选区域提取过程,自然也没有特征对齐步骤,各锚框的预测基于该层上每个特征点的感受野,其输入特征未被对齐,质量较差,因而定位和分类精度容易受到影响。

 

(3)以Faster R-CNN为代表的两步模型在第二步对候选区域进行分类和回归时,是针对每个候选区域独立进行的,因此该部分的算法复杂度线性正比于预设的候选区域数目,这往往十分巨大,导致两步模型的头重脚轻(heavy head)问题。

 

参考 :《百面深度学习-算法工程师带你去面试》

  • 4
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

乐亦亦乐

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值