【目标检测 深度学习】1.目标检测算法基础介绍


1.目标检测问题定义

1.1目标检测定义

目标检测是在图片中对可变数量的目标进行分类和查找。
主要难点:

  1. 目标种类与数量问题
  2. 目标尺度问题
  3. 外在环境干扰问题
  4. 形态、视角等变化

1.2目标检测vs图像分类

在这里插入图片描述

1.3目标检测vs目标分割

在这里插入图片描述
图三为语义分割,图四为实例分割。实例分割不仅要区分语义层面上的目标,同一类别的目标也需要划分出不同的实例。目标检测相对于目标分割更关注语义层面的分割结果,而目标分割更关注于像素级别处理的任务。目标检测主要定位物体的位置,主要表示为一个矩形,一个矩形可以通过一个四维的数据进行表示,目标分割需要对每一个像素点来进行不同类别的划分,我们的结果就需要同原始的图片大小保持一致,所以目标分割往往会采用上采样、反卷积这样的方式来得到原始图像大小的输出结果。
.

2.目标检测问题方法

2.1传统目标检测方法到深度学习目标检测方法的变迁

在这里插入图片描述
(1)传统目标检测算法比较有代表性的算法有V计算法,HOG,DPM等,这些方法主要是传统的手动提取特征并结合滑动窗口的方式来进行目标检测定位,存在问题主要有:

  1. 通过传统方式设计特征,特征难设计、特征存在的问题较多不鲁棒,比如特征对某些特定条件不适应、效率也不高
  2. 通过滑动窗口的方式生成目标框并对目标框进行分类判定这种策略比较繁琐,慢,耗时,所以在2008年DPM算法提出后目标检测算法遇到了很大的瓶颈,很难在DPM上进行提升。

(2)2012年卷积神经网络兴起之后利用卷积神经网络代替传统手工设计特征的方式来完成目标检测的任务,这也是基于深度学习目标检测算法的一个里程碑的事件,例如overfeat,RCNN方法的提出,但是这些方法在使用深度学习的时候只是利用卷积神经网络来提取特征,并没有从本质上改变搜索框提取目标区域的策略,因此这些方法在速度上依然存在瓶颈。

(3)Faster Rcnn等方法提出以后,通过RPN网络来代替原始的窗口策略,标志基于深度学习的目标检测方法彻底完成了一个端到端的过程,使得基于深度学习的目标检测方法在性能和速度上都得到很大地提升。

(4)Yolo SSD等方法不采用提取候选框的策略,而采用直接回归目标框的位置这一策略来完成目标检测和定位,再一次对目标检测算法速度进行了提升,而且在精度上也能保证原先基于propersal 候选框策略的算法基本一致。

2.2算法基本流程

在这里插入图片描述
上面图表示两种方法,有候选框特征提取的方法,和特征提取直接回归的方法。两种方法目前用得比较多的都是深度学习的方法,但是这个框架同样也适用于传统方法。

2.3传统目标检测方法

(1)viola-Jones方法。主要采用积分图特征,结合Adaboost分类器进行人脸检测等目标检测的任务。
(2)HOG+SVM。主要用于行人检测任务。通过对行人目标候选区域提取HOG特征并结合SVM分类器来进行判定。
(3)DPM。是基于HOG特征的一种变种,但DPM会加入很多的额外的策略来提升检测的精度,它是目前非深度学习目标检测方法中效果性能最优的一种方法。

2.4深度学习目标检测方法

(1)One-stage(YOLO和SSD系列) 它主要通过直接回归目标的位置这种方法来进行目标检测定位
(2)Two-stage(Faster RCNN系列)主要通过利用RPN网络对候选区域进行推荐
在这里插入图片描述

2.5传统目标检测方法VS深度学习目标检测方法

传统目标检测方法 深度学习目标检测方法
手动设计特征 深度网络学习特征
滑动窗口 Proposal或者直接回归
传统分类器 深度网络
多步骤 端到端
准确度和实时性差 准确度高和实时性好

2.6目标检测应用场景

人脸检测、文本检测、交通检测、通用物体识别、卫星图像等
.

3.传统目标检测算法

  • 7
    点赞
  • 42
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值