1.深度学习目标检测方法综述
深度学习目标检测方法综述\n
传统目标检测算法步骤
预处理
窗口滑动
特征提取
窗口大小、滑动方式与策略对其影响较大,例如卷积
特征选择
特征分类
后处理
二阶段的NMS处理
1)阈值不容易确定,设置小了会删除不该删除的框,设置大了会增加误检率
2)不满足要求的框会被直接删除,处理方式过于简单
基于深度学习的目标检测算法(核心问题与关键的技术挑战)
改进与优化主流目标检测算法的性能
基于双阶段算法的改进\n
基于单阶段算法的改进
基于双阶段和单阶段算法的结合
提高小目标物体检测精度 \n
骨干网络
一般修改基于 ImageNet 数据集训练的 VGG-16、GoogLeNet、ResNet-50 及 ResNet-101 等网络作为骨干网络
增加视觉感受野\n
指卷积神经网络每一层输出特征图上的像素点在原始输入图像上映射的区域大小
特征融合
基于贝叶斯决策理论的算法、基于稀疏表示理论的算法和基于深度学习理论的算法
主要利用基于深度学习理论的算法(例如FPN)
级联卷积神经网络
通过级联卷积神经网络提高检测模型的复杂度,从而提高\n网络的特征提取能力得到更多的小目标信息
模型的训练方式
实现多类别物体检测\n
问题
数据集类别数目较少,模型训练效果较差
随着物体类别的增加,计算量随之增大,速度和精度降低
方法
训练方式的优化
网络结构的改进
轻量化检测模型\n
网络结构
具体见轻量化扫盲
检测指标
准确率(accuracy)
分类对的样本所占的比例
精确率(precision)
识别出的正样本中,正确识别的正样本个数所占的比例
召回率(recall)
测试集中所有正样本样例中被正确识别的正样本个数所占的比例
平均精度(average precision,AP)
P-R 曲线下的面积,P-R 曲线上的点为某一阈值下该模型的准确率和召回率
平均精度均值(mean average precision,mAP)
分析与展望
适应特定场景
待解决问题问题
遮挡、模糊、扭曲等
未来研究方向
上下文信息、选择性参数共享、数据增强、互补特征融合
先验知识缺失
迁移学习或强化学习等基于弱监督或无监督\n的方法来训练目标检测模型
获取高性能的骨干网络
提高骨干网络针对不同任务的专一性
提高骨干网络的处理效率
获得更加丰富的图像语义信息
特征图高清表示
图像语义理解
提高深度学习模型的可解释性
利用胶囊网络等新结构
自动化生成或设计最优的网络架构
2.基于深度学习的视觉目标检测技术综述
3.基于计算机视觉的Transformer研究进展
4.基于深度学习的目标检测研究综述
5.基于深度学习的YOLO目标检测综述
6.基于深度学习的目标检测网络轻量化方法
- 赵永强,饶元,董世鹏,张君毅.深度学习目标检测方法综述[J].中国图象图形学报,2020,25(04):629-654.
- 曹家乐,李亚利,孙汉卿,谢今,黄凯奇,庞彦伟.基于深度学习的视觉目标检测技术综述[J].中国图象图形学报,2022,27(06):1697-1722.
- 刘文婷,卢新明.基于计算机视觉的Transformer研究进展[J].计算机工程与应用,2022,58(06):1-16.
- 谷永立,宗欣欣.基于深度学习的目标检测研究综述[J].现代信息科技,2022,6(11):76-81.DOI:10.19850/j.cnki.2096-4706.2022.011.020.
- 邵延华,张铎,楚红雨,张晓强,饶云波.基于深度学习的YOLO目标检测综述[J].电子与信息学报,2022,44(10):3697-3708.
- 杨贤志. 基于深度学习的目标检测网络轻量化方法[D].南京邮电大学,2021.DOI:10.27251/d.cnki.gnjdc.2021.000467.