SSD算法详解

SSD(Single Shot MultiBox Detector)是一种高效的目标检测算法,摒弃了传统的两阶段检测方法,通过单个神经网络完成检测。相比Faster R-CNN和YOLO,SSD在保持高速检测的同时,提高了准确性。关键改进在于使用不同尺度的特征映射进行预测,以及多比例默认边框的设计,使得模型能够适应多种尺寸的目标。在VOC2007数据集上,SSD在300×300和512×512的输入尺寸下分别达到74.3%和76.9%的mAP,展现出优秀的检测性能。
摘要由CSDN通过智能技术生成

论文背景

论文全称:Single Shot MultiBox Detector
论文链接:https://arxiv.org/abs/1512.02325
论文日期:2016.12.29

算法简介

本文既保证了检测速度的提高,同时保证了检测准确度的提高。
本文是在faster RCNN与YOLO之后提出来的,与原先的目标检测算法不同,未采用两阶段的神经网络,而是将整个检测过程封装为单个神经网络。这是提高检测速度的关键。

  1. 消除了候选区域提取的过程,直接将整张图片输入;
  2. 同时去除了随后的对于像素点或者特征进行重采样的阶段。

结果:
SSD使用300×300的图片作为输入,在VOC2007上达到了检测速度为59FPS,检测准确率为74.3%mAP;
SSD使用512×512的图片作为输入,在VOC2007数据集上检测准确率为76.9%mAP。
Faster RCNN在VOC2007上达到了检测速度为7FPS,检测准确率为73.2%mAP。
YOLO在VOC2007上达到了检测速度为45FPS,检测准确率为63.4%mAP;

改进:

  1. 使用小卷积核来预测目标的类别,并且抵消边界框的定位;
  2. 对于不同比例的检测过程,使用独立的卷积核;(最重要的改进:使用不同的比例的多个层用于预测)
  3. 为了将检测器应用于多尺寸,从神经网络的后阶段将这些卷积核应用到多个特征图中。

算法结构

SSD在训练过程,需要一整张图片以及对每个物体的真实框标签作为输入;
在卷积过程中,会对不同尺寸的几个特征映射中的每一个位置的的不同比例的少量默认框进行评估;
对于每个默认框,对于所有的目标类别都预测形状偏移以及置信度;
在训练时期,将这些默认框与真实框进行匹配;例如,对猫匹配两个默认框,对狗匹配一个默认框。这三个框被设为正样本,其他的被设为负样本。
损失函数是定

  • 3
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值