SSD：Single Shot MultiBox Detector

最新推荐文章于 2024-07-04 18:09:18 发布

曉_寧

最新推荐文章于 2024-07-04 18:09:18 发布

阅读量8.3k

点赞数 7

分类专栏：卷积神经网络

本文链接：https://blog.csdn.net/wweiainn/article/details/82831701

版权

论文链接：https://arxiv.org/abs/1512.02325论文翻译链接：https://blog.csdn.net/quincuntial/article/details/78854930 本文提出的SSD算法是一种直接预测目标类别和bounding box的多目标检测算法。与faster rcnn相比，该算法没有生成 proposal 的过程，这就极大提高了检测速度...

摘要由CSDN通过智能技术生成

论文链接：https://arxiv.org/abs/1512.02325

论文翻译链接：https://blog.csdn.net/quincuntial/article/details/78854930

本文提出的SSD算法是一种直接预测目标类别和bounding box的多目标检测算法。与faster rcnn相比，该算法没有生成 proposal 的过程，这就极大提高了检测速度。针对不同大小的目标检测，传统的做法是先将图像转换成不同大小（图像金字塔），然后分别检测，最后将结果综合起来。而SSD算法则利用不同卷积层的 feature map 进行综合也能达到同样的效果。算法的主网络结构是VGG16，将最后两个全连接层改成卷积层，并随后增加了4个卷积层来构造网络结构。对其中5种不同的卷积层的输出（feature map）分别用两个不同的 3×3 的卷积核进行卷积，一个输出分类用的confidence，每个default box 生成21个类别confidence；一个输出回归用的 localization，每个 default box 生成4个坐标值（x, y, w, h）。此外，这5个feature map还经过 PriorBox 层生成 prior box（生成的是坐标）。上述5个feature map中每一层的default box的数量是给定的(8732个)。最后将前面三个计算结果分别合并然后传给loss层。

基础

feature map cell:是指feature map中每一个小格子，就是上图中的每个小方格，上图分别有64个feature map cell 和16个feature map cell

default box：是指每个feature map cell上都有一系列固定大小的box，也就是上图中的虚线框。

ground truth：在机器学习中，数据是有标注的<x,t>， t是正确标注的ground truth。就好像上图中x是框的信息，t就是猫或者狗的信息。

prior box：是指在实际选择fdefault box 过程中（在实际选择中我们并不是每个feature map cell的k个default box 都取）也就是说 default box是一种概念，prior box则是实际的选取。

训练中一张完整的图片送进网络获得各个feature map，对于正样本训练来说，需要先将prior box与ground truth box做匹配（就是把一张图片输入到 region network中，判断有物体的区域就是prior box,可以看一下fast rcnn的解释），匹配成功说明这个prior box所包含的是个目标，但离完整目标的ground truth box还有段距离，训练的目的是保证default box的分类confidence的同时将prior box尽可能回归到ground truth box。

举个列子：在上图中一个训练样本中有2个ground truth box，所有的feature map中获取的default box一共有8732个。那个可能分别有10、20个prior box能分别与这2个ground truth box匹配上。训练的损失包含定位损失和回归损失两部分。

假设每个feature map cell有k个default box，那么对于每个default box都需要预测c个类别score和4个offset，那么如果一个feature map的大小是m×n，也就是有m*n个feature map cell，那么这个feature map就一共有（c+4）*k * m*n 个输出。这些输出个数的含义是：采用3×3的卷积核对该层的feature map卷积时卷积核的个数，包含两部分（实际code是分别用不同数量的3*3卷积核对该层feature map进行卷积）ÿ

最低0.47元/天解锁文章

曉_寧

关注

7
点赞
踩
31

收藏

觉得还不错? 一键收藏
0
评论
SSD：Single Shot MultiBox Detector

论文链接：https://arxiv.org/abs/1512.02325论文翻译链接：https://blog.csdn.net/quincuntial/article/details/78854930 本文提出的SSD算法是一种直接预测目标类别和bounding box的多目标检测算法。与faster rcnn相比，该算法没有生成 proposal 的过程，这就极大提高了检测速度...
复制链接

扫一扫

专栏目录