SSD算法使用了VGG网络。
SSD在数据部分做了充分的数据增强工作,包括光学变换与几何变换等
SSD在原始VGGNet的基础上,进一步延伸了4个卷积模块,最深处的特征图大小为1×1,这些特征图具有不同的尺度与感受野,可以负责检测不同尺度的物体。
SSD利用了固定大小与宽高的PriorBox作为区域生成,SSD在6个不同尺度上都设立预选框,并且在浅层特征图上设立较小的PriorBox来负责检测小物体,在深层特征图上设立较大的PriorBox来负责检测大物体。
(1)人工设置一系列PriorBox与标签里的边框进行匹配,并根据重叠程度筛选出正、负样本,得到分类与偏移的真值.这
(2)筛选出正、负样本后,从深层网络中拿出对应的样本的分类预测值与偏移预测值,与真值计算分类和偏移的损失。
第8个卷积层得到的特征图大小为10×10×512,每个点对应6个PriorBox,一共有600个PriorBox。由于采用的PASCAL VOC数据集的物体类别为21类,因此3×3卷积后得到的类别特征维度为6×21=126,位置特征维度为6×4=24。(多输出网络)