MMDetection目标检测知识汇总
目标检测其实是我一直在做的方向了。听完了这节课之后,对目标检测的总体都有一个很好的梳理。因此我写一个笔记来整理我目标检测的知识。
1.Overview
- 目标检测常用组件
- 单阶段&无锚框算法选讲
2. 目标检测技术演进
目标检测算法从机器学习方法到如今使用Transformer的方法以来,发展很久。它们其中也分为关注速度的一系列算法YOLO和高精度的算法如SwinTransformer。
3.目标检测常用组件
- 滑窗
滑窗其实是一种很朴素的技术方法,我们通过设定固定大小之后,在固定窗口中使用图片分类算法进行检测。但是这样遍历整张图片的算法会有很大的计算复杂度,这是我们不能接受的.
因此,我们使用卷积一次计算所有特征,再进行特征对应位置进行分类。这样可以提高滑窗效率。
- 感受野
感受野可以直观的理解为,特征图上的一个点可以看到原始图片多大的范围。能看到的范围即为感受野。
- 密集预测
这是在一张图片上做密集预测的pipeline
- 边界框回归
一般我们定义的滑窗的大小并不一定会刚好拟合物体在图片上的大小,我们需要通过回归边界框获取真实的预测框。
- 密集预测任务的训练
对于一个密集预测任务来说,我们需要在特征级别上进行Loss计算,而我们进行训练时使用的都是人工在图片上标注好的预测框。这种预测框不能直接监督图片的训练,而是需要先得到一个标注在特征图上的真值再进行训练。
- pipeline
图片进行目标检测的基本流程。
4. 单目标检测网络选讲
-
RPN
第一个模型是RPN,这是一个用在Faster RCNN上的目标检测第一阶段的方法。这个方法的主要工作就是给Faster RCNN选定RoI(感兴趣区域)。 -
YOLO
这个模型是一个很经典的one-stage目标检测方法。
- SSD
这个方法融合了多特征图而获得较好的结果
- RetinaNet
5.算法总结
对于是否有锚框的算法来说的流程都如上图所示。