SSD

版权声明:本文为博主原创文章,未经博主允许不得转载

论文:SSD: Single Shot MultiBox Detector

链接:https://arxiv.org/abs/1512.02325

第三方代码链接:https://github.com/balancap/SSD-Tensorflow

ECCV 2016


算法分析:


论文以 VGG16 为base model,保留前 5 层,去掉了pool5层,将fc6 和 fc7 改为卷积层再增加4 个卷积层。对其中5个不同的卷积层的输出分别用3*3的卷积核进行卷积,一个输出分类,每个default box生成21个类别(VOC数据集);一个输出回归,每个default box生成4个坐标值(x,y,w,h)。网络结构如下图所示:

匹配策略: 给定输入图像以及每个物体的 ground truth,首先找到每个ground true box对应的default box(IOU最大)作为正样本,然后在剩下的default box中找到与任意一个ground truth box 的 IOU 大于 0.5的default box作为正样本, 一个 ground truth 可能对应多个正样本default box ,其他的作为负样本。原文有一句话是这么说的,This simplifies the learning problem, allowing the network to predict high scores for multiple overlapping default boxes rather than requiring it to pick only the one with maximum overlap

 

目标函数:置信度采用 Softmax Loss),位置回归则是采用 Smooth L1 loss

 

scales and aspect ratios for default boxes:检测不同大小的物体,传统的做法是将图像转换成不同的大小,最后将结果综合起来.本文利用不同卷积层的feature map达到同样的效果,如fig1所示。假设我们用m个feature maps做预测,则不同feature map 的default box的计算如下所示:

  • scalesmin是0.2,smax是0.9
  •  ratio:使用不同的 ratio值a_r \in \left\{1, 2, \frac{1}{2}, 3, \frac{1}{3} \right \} ,default box 的宽度和高度:w_k^{a} = s_k\sqrt{a_r}h_k^{a} = s_k/\sqrt{a_r}。另外对于 ratio = 1 的情况,额外再指定 scale 为s_k{'} = \sqrt{s_ks_{k+1}} 也就是总共有6种不同的 default box。
  • default box中心:每个 default box的中心位置设置成 ( \frac{i+0.5}{  \left| f_k \right| },\frac{j+0.5}{\left| f_k \right| }  ) ,其中 \left| f_k \right|表示第k个特征图的大小 i,j \in [0, \left| f_k \right| ) 。

 

 

Hard negative mining:正负样本不平衡,负样本远大于正样本数量,作者将负样本按置信度大小进行排序,选择排名靠前的一些负样本作为训练,使得正样本和负样本比例保持1:3。

Data augmentation :为了模型更加鲁棒,作者对数据进行了如下方式

  • 整张图片
  • 和groudtruth至少重叠0.1, 0.3,0.5, 0.7, or0.9 (一般取0.3)的patch 
  • 随机采取一个patch

patch 在原图大小的 [0.1,1] 之间, 相应的宽高比在[1/2,2]之间


实验结果:


参考:https://blog.csdn.net/u014380165/article/details/72824889

https://zhuanlan.zhihu.com/p/24954433?refer=xiaoleimlnote


补充:摘自https://www.zhihu.com/question/49455386

小目标检测效果不好:

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值