OpenMMLab学习笔记06
前言
主要介绍mmdetection理论知识
一、目标检测
二、object detectio & classification
三、od应用
- 人脸识别
- 自动驾驶
- 下游视觉任务
四、od演进
五、基本概念
1.框
2.交并比
3.感受野
4.感受野的中心与步长
5.有效感受野
6.置信度
六、目标检测问题难点
将分类与定位更具完善,同时处理图像中物体更多的语义信息
七、基本范式
一个好的检测器应该满足不重不漏的要求
1.滑窗
- 设定一个固定大小的窗口
- 遍历图像所有位置,所到之处所用的分类模型识别窗口中的内容
- 为了检测不同大小、不同形状的物体,可以使用不同大小、长宽比的窗口扫描图片
1.问题
计算成本过大
2.改进思路
- 使用启发式算法替换暴力遍历,比如Faster-RCN,但现在已经不再使用
- 减少冗余计算,使用密集预测。在滑窗算法中,一个图像的许多部分被一个同样的卷积核卷了好多次,是重复的计算,因此如果可以将这些重复的计算消去,则可以大大提升效率。考虑是否可以一次性计算所有的特征,再取出对应位置的特征进行分类。由原图滑窗改进为特征图滑窗。
卷积存在位置不变性
3.边界框回归
-
方法一:基于锚框
-
方法二:无锚框
4.非极大值抑制
5.密集预测基本流程
6.密集预测模型训练
7.密集预测基本范式
2.多尺度预测
多尺度预测是对密集预测的改进,主要是指不同的大小的物体的预测。在朴素的密集检测中,受限于结构,更加擅长中等大小的物体,对于小物体检测能力较弱,定位精度低。
1.基于锚框(Anchor)
2.图像金字塔
3.基于层次化特征
4.特征金字塔(FPN)
总结
目标检测理论知识