目标检测中的one-stage和two-stage
- two-stage:Fast-RCNN
将检测问题划分为两个阶段:产生候选区+对候选区进行分类
特点:错误率低,漏识别率低,但速度较慢,不能满足实时检测场景。 - one-stage:YOLO,SSD
不需要产生候选区,直接产生物体的类别和位置坐标值
特点:更快的检测速度
SSD(single shot multibox detector)
1. SSD结构
SSD是2016年提出的one-stage目标检测算法,主网络结构为VGG16.
VGG-16部分尺寸较大,感受野较小,用于识别较小的目标,后面的特征层尺寸较小,感受野较大,用于识别较大的目标。每个用于目标检测的特征图上会生成4个或者6个预选框,例如:VGG-16的特征层会产生4个预选框。
值得注意的是:在VGG-16的最后一层卷积池化后尺寸没有发生变换,这是为了防止特征尺寸大小难以满足小物体的识别:采用步长为1的池化+rate=6的空洞卷积操作,使得尺寸没有发生变化19*19。
特征图中每个点会产生一个预测值,每个预测值中涵盖两类数据:预测框的4个参数+预测目标的类别
2. 特征金字塔
3. SSD损失函数loss
SSD目标损失函数包含两部分:预选框与目标类别的confidence loss+相应的位置回归损失
match策略
- 训练时,真实框(ground truth box)与预