目标检测问题定义
目标检测是在图片中对可变数量的目标进行查找和分类。
- 目标种类与数量问题
- 目标尺度问题
- 外在环境干扰问题
框上有类别和置信度(有阈值限定)
特征提取是重点!
目标分割:语义分割(除去背景区域的其他区域位置,精确到像素级别)
实例分割:实例层面的。更细致。
图像分类:只指出类别。

目标检测的方法
传统方法到深度学习方法的变迁。
1、传统方法:VJ、HOG、DPM(基于传统手工特征的检测算法,滑动窗口进行目标检测定位)
存在问题:特征难设计,设计的特征会对特定条件不适应等问题。通过滑动窗口方式流程繁琐,耗时。
2、深度学习方式:Overfeat、RCNN、(前两者只是利用卷积神经网进行特征提取,并没有本质上改变搜索框提取目标区域的策略,速度慢)SPPNet、Fast RCNN(通过RPN网络)、Faster RCNN、YOLO、SSD(不采用提取候选框的策略,直接回归目标框位置)、Pyramid Networks、Retina-Net(按时间顺序排序)
目标检测方法:

NMS进行候选框的合并。
传统的目标检测方法:
Viola-Jones
HOG + SVM

本文介绍了目标检测的基本问题,包括目标种类与数量、尺度、环境干扰等挑战,以及检测任务中的类别和置信度要求。重点讨论了特征提取的重要性。此外,文章还对比了目标检测与图像分类、目标分割的区别。在方法部分,概述了从传统方法如VJ、HOG、DPM到深度学习方法的演变,如Overfeat、RCNN、YOLO、SSD等,分析了各自的优缺点。最后,提到了NMS在候选框合并中的作用。
最低0.47元/天 解锁文章
694

被折叠的 条评论
为什么被折叠?



