SSD

最新推荐文章于 2021-11-10 14:17:37 发布

xin心扉

最新推荐文章于 2021-11-10 14:17:37 发布

阅读量317

点赞数

分类专栏：目标检测

本文链接：https://blog.csdn.net/weixin_41172694/article/details/88060685

版权

目标检测专栏收录该内容

16 篇文章 0 订阅

订阅专栏

论文：SSD: Single Shot MultiBox Detector

链接：https://arxiv.org/abs/1512.02325

第三方代码链接：https://github.com/balancap/SSD-Tensorflow

ECCV 2016

算法分析：

论文以 VGG16 为base model，保留前 5 层，去掉了pool5层，将fc6 和 fc7 改为卷积层再增加4 个卷积层。对其中5个不同的卷积层的输出分别用3*3的卷积核进行卷积，一个输出分类，每个default box生成21个类别（VOC数据集）；一个输出回归，每个default box生成4个坐标值（x，y，w，h）。网络结构如下图所示：

匹配策略： 给定输入图像以及每个物体的 ground truth,首先找到每个ground true box对应的default box（IOU最大）作为正样本，然后在剩下的default box中找到与任意一个ground truth box 的 IOU 大于 0.5的default box作为正样本，一个 ground truth 可能对应多个正样本default box ，其他的作为负样本。原文有一句话是这么说的，This simplifies the learning problem, allowing the network to predict high scores for multiple overlapping default boxes rather than requiring it to pick only the one with maximum overlap

目标函数:置信度采用 Softmax Loss），位置回归则是采用 Smooth L1 loss

scales and aspect ratios for default boxes:检测不同大小的物体，传统的做法是将图像转换成不同的大小，最后将结果综合起来.本文利用不同卷积层的feature map达到同样的效果,如fig1所示。假设我们用m个feature maps做预测，则不同feature map 的default box的计算如下所示：

scale：smin是0.2，smax是0.9。
ratio：使用不同的 ratio值 $a_r \in \left\{1, 2, \frac{1}{2}, 3, \frac{1}{3} \right \}$ ，default box 的宽度和高度： $w_k^{a} = s_k\sqrt{a_r}$ ， $h_k^{a} = s_k/\sqrt{a_r}$ 。另外对于 ratio = 1 的情况，额外再指定 scale 为 $s_k{'} = \sqrt{s_ks_{k+1}}$ 也就是总共有6种不同的 default box。
default box中心：每个 default box的中心位置设置成 $( \frac{i+0.5}{ \left| f_k \right| },\frac{j+0.5}{\left| f_k \right| } )$ ，其中 $\left| f_k \right|$ 表示第k个特征图的大小 $i,j \in [0, \left| f_k \right| )$ 。

Hard negative mining：正负样本不平衡，负样本远大于正样本数量，作者将负样本按置信度大小进行排序，选择排名靠前的一些负样本作为训练，使得正样本和负样本比例保持1:3。

Data augmentation ：为了模型更加鲁棒，作者对数据进行了如下方式

整张图片
和groudtruth至少重叠0.1, 0.3，0.5, 0.7, or0.9 （一般取0.3）的patch
随机采取一个patch

patch 在原图大小的 [0.1,1] 之间，相应的宽高比在[1/2,2]之间

实验结果：

参考：https://blog.csdn.net/u014380165/article/details/72824889

https://zhuanlan.zhihu.com/p/24954433?refer=xiaoleimlnote

补充：摘自https://www.zhihu.com/question/49455386

小目标检测效果不好：

xin心扉

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
SSD

版权声明：本文为博主原创文章，未经博主允许不得转载论文：SSD: Single Shot MultiBox Detector链接：https://arxiv.org/abs/1512.02325第三方代码链接：https://github.com/balancap/SSD-TensorflowECCV 2016算法分析：论文以 VGG16 为base model，保留前 5...
复制链接

扫一扫