OpenMMLab 学习三: MMDet 检测
边界框(Bounding Box):框,泛指矩形框;边界框,物体的外接矩阵框。一般由左上右下(l, t, r, b)或中心坐标及宽高(x, y, w, h)
区域(Area):同边界框
感兴趣区域(Region of interest,ROI):需要进一步检测框中是否有物体
锚框(Anchor Box):预设的基本框,类似滑窗(部分算法会依赖锚框去预测边界框)
交并比(IoU):为两个矩形的交集面积与并集的面积比值(∈ [0, 1])
置信度(Confidence Score):模型认为自身预测结果的程度
非极大值抑制(Non-Maximum Suppression,NMS):再物体周围会存在多个相近的检测框,而且这些框都指向同一物体,这时只需保留其置信度最高的
边界框回归(Bounding Box Regression):在预测物体类别时,同时计算预测边界框和边界框的偏移量
边界框编码(Bbox Coding):边界框的偏移量在数值上一般较大(不利于训练),通常需要对偏移量进行编码(有点类似缩放)
目标检测
sliding window
步骤
-
设定固定大小的窗口
-
遍历图像(类似卷积),将框内图像进行图像分类
为了可以检测不同物体,可以改变窗口的大小、宽高比。
缺陷:效率很慢,因为滑窗较多推理一张图片通常要进行成千上万次的图像分类。
改进方案
-
区域提议(RCNN)
-
消除滑窗重复,使用卷积计算所有特征,再对特征进行滑窗识别(减少重复区域,降低窗口个数从而提升效率,Fast RCNN)
-
密集预测(滑窗卷积一起做,YOLO)