目标检测是通过训练模型,以画框框的形式将图片中目标的位置,类别检测出来,如下图所示:
目前最有流行最有效的目标检测方法有三种,分别是Faster Rcnn,YOLO和SSD。
下面我们了解一下作为目标检测三大方法之一的SSD(Single Shot MultiBox Detector),我们都知道两点(x1,y1)和(x2,y2)确定框框,但是目标检测框框是由中心点坐标(x,y)和框的长宽(h,w)来确定的,方便生成长宽比为(1,2,1/2)的锚框。
基本思路:
- 生成一系列尺寸不同的默认框default box
- 寻找和ground truth box(用labelimage自己标注的框)相近的default box用于框回归
- 对default box里的目标进行分类
默认框(先验框)的生成及大小位置相关计算:
SSD的网络结构图:
SSD网络结构图相关内容解读如下所示:
SSD网络结构的关系图如下:
从整个网络结构关系图可以看出,获得每个特征图之后,分为三大步:
- 路线表示生成各个特征层的先验框,需要与真实框进行对比,筛选正负样本(计算Jaccard重叠,大于0.5选作正样本,记作1,其他为负样本,记作0)
- 红线表示边界框的预测
- 蓝线表示类别的置信度
各个任务具体方式如下图:
其中,训练的目标函数是: