深度学习目标检测技术的综述笔记

基于深度学习的目标检测技术的研究综述-阅读笔记


一、传统目标检测:

流程:

1 采用不同尺度的滑动窗口在图像中的不同位置选取候选区域 耗时长、窗口存在冗余

2 提取候选区域的特征信息 手工提取的特征信息鲁棒性较差
3 利用分类器对特征信息进行识别 大数据图片/视频信息处理能力差

常用传统目标检测方法:

1 基于像素分析
2 基于特征匹配
3 基于频域的方法‘
4 基于识别的检测方法

二、深度学习目标检测

确定性模型:采用概率化描述,采用最大似然估计来最大化关于训练数据的似然函数 (深度置信网络DBN,深度玻尔兹曼机DBM)
在这里插入图片描述

三、“双阶段”目标检测算法

在这里插入图片描述
第一阶段:通过EdgeBoxes, Selective Search等目标候选区域生成算法生成 一组稀疏连接的候选区域,并将候选结果送入CNN模块中
第二阶段:将提取出的特征信息进行分类和回归

1 “Rich feature hierarchies for object detection and semantic segmentation”-2014

Region-CNN ( R-CNN ) 基于“区域推荐”的方法
Region-CNN ( R-CNN ) 基于“区域推荐”的方法:
1 Selective Search 以自上而下的搜索方法抽取2000个推荐区域
2 CNN向前传播计算出区域的特征信息
3 使用对每个类别训练出的SVM 给整个特征向量中的每个类别单独打分
4 采用非极大抑制(NVM)和边界框回归定位 出最准确的位置区域

不足:
1 存在全连接层,需要固定输入尺寸,强行对输入尺寸进行变换和放缩操作会造成数据失真
2 Selective Search 过程耗费大量时间与空间

2 “Spatial pyramid pooling in deep convolutional networks for visual recognition”-2014

Spation Pyramid Pooling ( SPP-net )  “空间金字塔池化”
Spation Pyramid Pooling ( SPP-net ) “空间金字塔池化”
1 结合空间金字塔的方法来实现CNN对输入尺度的可变性
2 只对原图提取一次卷积特征 的方法,提高速度和检测精度

不足:网络微调只更新了全连接层,不能实现端到端的检测 且检测精度还有进一步提升空间

3 “Fast R-CNN”-2015

针对R-CNN算法在候选区域进行特征提取时存在重复计算且耗时长的问题而提出的一种改进算法
在这里插入图片描述
1 通过卷积网络传递整张图像
2 以投影的方式得到候选区域对应的感兴趣区域(ROI)
3 通过池化层得到固定尺度的特征向量
4 将边界框回归于区域分类合并成一个多任务模型,输出分类器和回归器

不足:算法采用了选择性搜索来找出所有候选框,耗费时间

4 “Faster R-CNN: Towards real-time object detection with region proposal networks”-2017

在Fast R-CNN的基础上改进而来(关键:RPN层)
在这里插入图片描述
1 卷积层提取图像的特征信息并输出特征映射图
2 RPN网络(Region Proposal Network)全卷积层 推荐候选区域
3 感兴趣区域池化层(ROI)将不同大小的候选区域映射为一个固定尺度的特征向量
4 分类器输出候选区域所属的类别和候选区域的精确定位

优点:RPN网络将全连接层替换为全卷积层,代替了选择性搜索 ,较大的提高了检测速度

四 “单阶段”目标检测算法

本文中暂不概述

五 通用目标检测常用数据集

1 PASCAL VOC
2 ImageNet
3 Open Images:现有最大的包含对象位置注释的数据集

六 基于深度学习的目标检测应用场景

1 行人检测
存在复杂的姿态变化,光照不均匀,局部范围遮挡
“Repulsion loss: detecting pedestrians in a crowd” -2018
基于改进的边界框回归损失目标的检测方法
“High-level semantic feature detection: a new perspective for pedestrian detection” -2018
高级语义特征的行人检测方法
2 医学图像检测
特点是检测目标物体细粒度的差异,目标物体形状尺寸位置变化大、病变组织和非病变组织差异小
“Deep image mining for diabetic retinopathy screening” -2017
“Object detection for medical images” -2019
3 人脸检测
人脸尺度多变、姿态、遮挡、表情、光照等问题导致检测率较低
“Dual shot face detector” -2019
“Relationship learning with person-specific regularization for facial action unit detection” -2018

总结

以上就是今天要讲的内容,本文仅仅简单介绍了基于深度学习的目标检测技术近些年常用的一些方法和应用,双阶段目标检测算法与单阶段目标检测算法的具体过程将在之后的博文中详细介绍。
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值