目标检测
人脸识别、智慧城市、自动驾驶(环境感知、路径规划)、下游视觉任务(识别文字,人体检测)等
滑窗
识别不同的物体可以采用不同比例大小的滑窗
–>效率低
改进:
- 使用启发式算法
- 减少冗余计算,进行密集预测(目前采用)
- 用卷积一次性计算所有特征,再取出对应位置的特征完成分类
- 在特征图上进行密集预测:
分析滑窗中的重复计算:
区域提议
基础知识
交并比: 定义为两矩形框交集面积与并集面积之比,是矩形框重合程度的衡量指标
**置信度: **模型认可自身预测结果的程度,通常需要为每个框预测一个置信度
非极大值抑制: 滑窗类算法通常会在物体周围给出多个相近的检测框 这些框实际指向同一物体,只需要保留其中置信度最高的
**边界框编码:**边界框的绝对偏移量在数值上通常较大,不利于神经网络训练,通常需要对偏移量进行编码,作为回归模型的预测目标
两阶段目标检测算法
两阶段的检测范式最早由 R-CNN 确立,因包含 区域提议和区域识别两个阶段得名
多尺度检测技术
图像金字塔、层次化特征
特征金字塔网络
单阶段目标检测算法
YOLO