物体检测中的单步模型（one-stage）和两步模型（two-stage）

最新推荐文章于 2024-04-05 20:46:52 发布

乐亦亦乐

最新推荐文章于 2024-04-05 20:46:52 发布

阅读量2.8k

点赞数 4

分类专栏：深度学习

本文链接：https://blog.csdn.net/qq_41251963/article/details/108723528

版权

深度学习专栏收录该内容

22 篇文章 7 订阅

订阅专栏

物体检测模型大致可以分为单步（one-stage）和两步（two-stage）模型两大类。

单步模型：指没有独立地、显示地提取候选区域（region proposal），直接由输入图像得到其中存在的物体的类别和位置信息的模型。（在计算效率上有优势）

典型的单步模型有：OverFeat、SSD（Single Shot multibox-Detector ）、YOLO（You Only Look Once）等

两步模型：有独立的，显示的候选区域提取过程，即先在输入图像上筛选出一些可能存在物体的候选区域，然后针对每个候选区域，判断其是否存在物体，如果存在，就给出物体的类别和位置修正信息。（在检测精度上有优势）

典型的两步模型有：R-CNN、SPPNet、Fast R-CNN、Faster R-CNN、R-FCN、Mask R-CNN等。

（1）多数单步模型是利用预设的锚框（Anchor Box）来捕获可能存在于图像中各个位置的物体。因此，单步模型会对数量庞大的锚框进行是否含有物体及物体所属类别的密集分类。由于一幅图像中实际含有的物体数目远小于锚框的数目，因而在训练这个分类器的时候，正负样本数目是极不均衡的，这会导致分类器训练效果不佳。RetinaNet通过Focal Loss来抑制负样本对最终损失的共献以提升网络的整体表现。在两步模型中，由于含有独立的候选区域提取步骤，第一步就可以筛选掉大部分不含有待检测物体的区域（负样本），在传递给第二步进行分类和候选框位置/大小修正时，正负样本的比例已经比较均衡，不存在类似的问题。

（2）两步模型在候选区域提取的过程会对候选框的位置和大小进行修正，因此进入第二步前，候选区域的特征已对齐，有利于为第二步的分类提供质量更高的特征。两步模型在第二步候选框会被再次修正，因此一共修正了两次候选框，这带来了更高的定位精度，但同时也增加了模型复杂度。单步模型没有候选区域提取过程，自然也没有特征对齐步骤，各锚框的预测基于该层上每个特征点的感受野，其输入特征未被对齐，质量较差，因而定位和分类精度容易受到影响。

（3）以Faster R-CNN为代表的两步模型在第二步对候选区域进行分类和回归时，是针对每个候选区域独立进行的，因此该部分的算法复杂度线性正比于预设的候选区域数目，这往往十分巨大，导致两步模型的头重脚轻（heavy head）问题。

参考：《百面深度学习-算法工程师带你去面试》

乐亦亦乐

关注

4
点赞
踩
9

收藏

觉得还不错? 一键收藏
打赏
0
评论
物体检测中的单步模型（one-stage）和两步模型（two-stage）

物体检测模型大致可以分为单步（one-stage）和两步（two-stage）模型两大类。单步模型：指没有独立地、显示地提取候选区域（region proposal），直接由输入图像得到其中存在的物体的类别和位置信息的模型。（在计算效率上有优势）典型的单步模型有：OverFeat、SSD（Single Shot multibox-Detector ）、YOLO（You Only Look Once）等两步模型：有独立的，显示的候选区域提取过程，即先在输入图像上筛选出一些可能存在物体的..
复制链接

扫一扫