【论文阅读笔记】SSD:Single Shot MultiBox Detector

地址:SSD:Single Shot MultiBox Detector
时间:2015年12月发布,2016年12月最终


全文概括

  SSD引入了Faster RCNN的anchor,使用多level 的 feature map来进行分类和回归,从而增强多尺度的语义信息(SSD应用在不同尺度的feature 上)。
在这里插入图片描述
  在VOC 2007 test数据集上,SSD达到 74.3 % 74.3\% 74.3%的mAP及 59 59 59FPS;而Faster R-CNN 达到 73.2 % 73.2\% 73.2%的mAP及 7 7 7FPS、YOLO达到 63.4 % 63.4\% 63.4%的mAP及 45 45 45FPS。即SSD达到了当时最好的性能,且比YOLO要快(个人认为,在骨架网络上,SSD与YOLO最大的区别在于没有后面的fc层,即速度的提升来自于conv层代替fc层。fc层需要更大的内存,而conv可以通过数据复用,减少访问存储的次数。而且,conv层的可优化加速空间更大)

  在不同level的feature map上,使用的检测网络(分类和回归)是不一样的,即不共用。


SSD模型

  骨干网络使用VGG16,但fc6和fc7变成conv layer,移除fc8和dropout层,pool5从22-stride2变成33-stride1;
  检测网络在每个不同level的feature map是不同的,假设该层feature map有p个channel,使用33p的卷积核得到输出的一个维度(即预测其中的一个值,类别分数或者边框offset);
  每个anchor都计算分类分数和边框偏移;


模型相关训练方法

  模型训练时,使用硬负样本缩减策略,正负比例为1:3;
  标记样本时,重叠率超过0.5就标记为ground truth;[作者认为,这简化了学习问题,允许网络给多个重叠annchor高分,而不是要求它仅选最大重叠的框];
  损失函数使用和Faster RCNN一样的:平滑L1损失函数+softmax loss;

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值