SSD全称:Single Shot MultiBox Detector
特点:
- 增加多尺度feature map。
- 在feature map上使用小的卷积核预测一系列 bounding boxes 的 box offsets
- 与Faster R-CNN和YOLO相比性能更优。
SSD结构
这一幅图表示 SSD 的大概流程:首先用 VGG 或者 ResNet 等一些分类网络生成
feature map,然后在 feature map 上直接并且同时进行预测回归。
下面看一下 SSD 架构:首先输入 300×300 大小的图像,在 VGG-16 中的第 6 层全连接层改为了卷积层,在第 8 层中,先通过了 1×1 的卷积,然后再进行 3×3 的
512,步长为 2 的卷积,后面也是一样的。针对得到不同尺度的 feature map,对
这5个进行3×3的卷积,输出两个结果,一个输出分类用的confidence,每个default
box 生成 21 类的 confidence(数据集里面 20 类+1 类背景)另外一个用于边框的
回归,输出 localization,每个 default box 生成 4 个坐标值