（七）目标检测算法之SSD

最新推荐文章于 2021-08-03 15:02:37 发布

diaoer7075

最新推荐文章于 2021-08-03 15:02:37 发布

阅读量260

点赞数

文章标签：人工智能

原文链接：http://www.cnblogs.com/kongweisi/p/11151791.html

版权

系列博客链接：

（一）目标检测概述 https://www.cnblogs.com/kongweisi/p/10894415.html

（二）目标检测算法之R-CNN https://www.cnblogs.com/kongweisi/p/10895055.html

（三）目标检测算法之SPPNet https://www.cnblogs.com/kongweisi/p/10899771.html

（四）目标检测算法之Fast R-CNN https://www.cnblogs.com/kongweisi/p/10900021.html

（五）目标检测算法之Faster R-CNN https://www.cnblogs.com/kongweisi/p/10904260.html

（六）目标检测算法之YOLO https://www.cnblogs.com/kongweisi/p/11001688.html

本文概述：

目标
- 知道SSD的结构
- 说明Detector & classifier的作用
- 说明SSD的优点

1 SSD

1.1 简介

SSD算法源于2016年发表的算法论文，论文网址：https://arxiv.org/abs/1512.02325

SSD的特点在于:

SSD结合了YOLO中的回归思想和Faster-RCNN中的Anchor机制，使用全图各个位置的多尺度区域进行回归，既保持了YOLO速度快的特性，也保证了窗口预测的跟Faster-RCNN一样比较精准。
SSD的核心是在不同尺度的特征特征图上采用卷积核来预测一系列Default Bounding Boxes的类别、坐标偏移。

1.2 结构

以VGG-16为基础，使用VGG的前五个卷积，后面增加从CONV6开始的5个卷积结构，输入图片要求300*300。

1.3 流程

SSD中引入了Defalut Box，实际上与Faster R-CNN的anchor box机制类似，就是预设一些目标预选框，

不同的是在不同尺度feature map所有特征点上是使用不同的prior boxes

1.4 Detector & classifier

Detector & classifier的三个部分：

1.default boxes: 默认候选框
2.localization：4个位置偏移
3.confidence：21个类别置信度(要区分出背景)

1.4.1 default boxes

default boxex类似于RPN当中的滑动窗口生成的候选框，SSD中也是对特征图中的每一个像素生成若干个框。

只不过SSD当中的默认框有生成的公式

了解：

ratio:长宽比
默认框的大小计算参数：s_min:最底层的特征图计算参数，s_max最顶层的特征图计算参数

1.4.2 localization与confidence

这两者的意义如下，主要作用用来过滤，训练

经过这一次过滤操作，会将候选框筛选出数量较少的prior boxes。

关于三种boxes的解释区别：

gournd truth boxes：训练集中，标注好的待检测类别的的位置，即真实的位置，目标的左下角和右上角坐标
default boxes：在feature map上每一个点上生成的某一类别图片的位置。feature map每个点生成4或6个box（数量是事先指定的），格式为转换过后的(x, y, w, h)
prior boxes：经过置信度阈值筛选后，剩下的可能性高的boxes。这个box才是会被真正去做回归

也就是说SSD中提供事先计算好的候选框这样的机制，只不过不需要再像RPN那种筛选调整，

而是直接经过prior boxes之后做回归操作（因为confidence中提供了21个类别概率可以筛选出背景）