目标检测模型
- 参考资料
(1)52 个深度学习目标检测模型汇总
- 目标检测:通用目标检测 和 特定领域目标检测
(1)目标检测是一个分类、回归问题的叠加。
(2)目标检测的核心问题
[1] 分类问题:即图片(或某个区域)中的图像属于哪个类别。
[2] 定位问题:目标可能出现在图像的任何位置。
[3] 大小问题:目标有各种不同的大小。
[4] 形状问题:目标可能有各种不同的形状。
(3)通用目标检测:用统一的框架检测不同物体。
(4)特定领域目标检测:如人脸检测,行人检测,文字检测等
- 目标检测器:大多数利用 深度学习网络 作为其骨干和检测网络,从输入图像、分类和定位中提取特征。
(1)对象检测的深入研究领域包括多类别检测、边缘检测、显着对象检测、姿势检测、场景文本检测、人脸检测、和行人检测等作为场景的重要组成部分。
- 流行的检测算法可以分为两类
(1) two-stage 算法: 基于Region Proposal , 算法先产生目标候选框(目标位置),然后再对候选框做分类与回归。
[1] 任务流程:特征提取 --> 生成RP --> 分类/定位回归
[2] 准确度高一些,但是速度慢
[3] 候选区域产生
a. 滑窗法: 滑窗–>分类器–>NMS筛选
b. 候选区域(选择搜索): 分割算法–>很多子区域–>相似性(颜色,纹理等)子区域合并–>合并的子区域做bounding boxes(外切矩形)
[4] 代表算法:R-CNN系算法(R-CNN, Fast R-CNN, Faster R-CNN等),SPP-Net, 下图是R-CNN 和 Fast R-CNN 的流程
(2) one-stage算法: 仅使用一个卷积神经网络CNN直接预测不同目标的类别与位置
[1] 任务流程:特征提取–> 分类/定位回归
[2] 速度快,但是准确性要低一些
[3] 代表算法是Yolovx, SSD, RetinaNet等。