文献阅读笔记<<基于深度学习的目标检测算法研究进展>>

 1.目标检测:(Object Dection,OD)是一种从视频或者图片中找到感兴趣的区域并标记出来的行为动作, 可以通过算法提取特征来识别定位特定类别的对象。 目标检测主要应用在人脸识别、无人驾驶、指挥以及安防等领域。目标检测功能的核心不在于硬件设备, 而在于算法设计的优劣。不同算法性能的优劣将直接导致目标检测在不同场景下的检测效果。

2.自 1998 年美国工程师提出目标检测概念以来, 产生了大量基于手工设计特征的传统算法。这些算 法大多是借鉴穷举的思想,在基于滑动窗口生成的 候选框内提取特征,并将特征交给分类器去识别。因为早期很多的目标检测算法 缺乏有效的特征表示,所以设计了许多复杂的特征 表示和在有限资源情况下处理特征加速的技巧。然 而,传统的目标检测算法仍存在问题:为生成足够 的候选区域,计算机的逻辑运算开销巨大;在提取特征时由于特征较多,筛选过程过于缓慢,分类速 度和精度达不到实际应用的标准。

3.Girshick 等 率先提出了将具有卷积神经网络的区域应用于目标检测, 从而打破了传统目标检测算法性能趋于饱和的僵局。

4.基于深度学习的目标检测算法主要分为基于锚点类模型基于无锚点类模型两种。                         基于锚点类模型:分为单阶段方法和二阶段方法。主流算法分为基于关键点和密集预测两类。          单阶段方法:法只需要提取特征、分类和定位回归即可。                                                                   二阶段方法:比单阶段方法多一个生成候选框的步骤,即提取特征后生成候选框再分类定位回归.

5.二阶段目标检测:                                                                                                                               二阶段目标检测算法是基于回归的算法,由两个阶段组成。先通过策略生成锚点框,后将锚点框 通过处理后进行回归定位。二阶段的经典主流算法主要有 R-CNN、SPP-Net、Fast R-CNN、Faster RCNN、R-FCN 以及 FPN 等。                                                                                             R-CNN:第一个工业级的目标检测算法.。R-CNN 算法首先通过选择性搜索 [6] 生成约 2 000 个建议框,将每个建议框调整为同一尺寸即 227 pixel×227 pixel,后将其放入AlexNet中提取特征得到特征图。SVM算法对提取的特征进行处理,然后每个类别都会形成一个对应向量,同时也会出现一个分值,最后使用非极大值抑制的技巧进行比对处理。同时,使用基于回归的方法调整生成的矩形框,使之对目标的包围更加精确。R-CNN算法使目标检测的精度得到了质的改变,是将深度学习应用到目标检测领域的里程碑之作,也奠定了基于深度学习的二阶段目标检测算法的基础 [7]。

 R-CNN 的主要特点是将大规模的卷积神经网络应用于候选框来提取特征,但也存在一些问题。 第一,每个候选框需要单独计算,且有的候选框重叠在一起,导致所需计算资源巨大;第二,训练过程的4个步骤单独完成,缓存数据独立保存,导致训练过程复杂;第三,前两个缺点导致运行速度相对较慢,无法满足实时性需求;第四,对图像的输入大小有约束,要求图像的尺寸为 227 pixel×227 pixel,对图像要进行缩放操作会破坏图像的信息,降低检测器的检测精度。

 6.单阶段目标检测                                                                                                                                   二阶段单阶段目标检测算法是直接进行定位回归的算法,比二阶段方法减少了分阶段步骤,所以检测速度更快。基于深度学习技术的单阶段目标检 测主流算法主要包括 REDMON[25] 等提出的 YOLO 算法及其系列和 Liu[26] 等提出的 SSD 算法及其系列。 两种算法系列均是对原始图像直接进行特征提取, 计算出目标物体的类别概率和位置坐标值 。

7.YOLOv1算法                                                                                                                                       2015 年,Redmon[25] 等提出了 YOLO 方法,最 大特点提升检测速度达到 45 张 / 秒,开始了端到端 的目标检测技术的发展。YOLOv1 先对图像进行预 处理,将图片调整为指定大小,然后类似于回归处 理来进行卷积提取检测。具体网络结构如图 8 所示。 YOLOv1 相对于 Faster R-CNN,牺牲了检测准度和 定位精度,但是检测速度提高了近 7 倍。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值