SSD原理解读

1、引言

目标检测是计算机视觉学科的重要研究方向之一,在很多场合中都很重要,比如无人驾驶,就非常需要目标检测给它提供非常高的检测和定位精度。当前,目标检测中基于深度学习的算法大概可以分为两种:分步目标检测算法(比如Fast R-CNN[11]、Faster R-CNN[12]等);单步目标检测算法(比如YOLO[13]、SSD[14]等)。前者先要产生一批用作输入数据的候选框,然后经过神经网络回归分类得到结果;后者不生成候选框,直接将预测边框的任务变成回归问题解决。虽然Faster R-CNN检测性能较好,但是由于采用了RPN和Fast R-CNN两种网络,所以导致结构较为复杂,检测的速度不够快速。

SSD算法是一种端到端的单次多框实时检测的深度神经网络模型,融合了YOLO的回归思想和Faster R-CNN的候选框机制。SSD算法利用回归的思想极大地减少了神经网络的计算量,提升了算法运行的速度。它不需要生成候选框,而是直接提取输入图片的特征信息,然后直接在特征图上回归这个位置的边界框以及对物体类别进行分类;运用局部特征提取的方法得到不同位置,不同宽高比、尺寸的特征,这一点相比于 YOLO 针对某一位置进行全局特征提取的方式更加有效率。此外,为了增加模型检测不同大小物体的鲁棒性,SSD算法选取网络中多个层次的特征图进行预测。

2、SSD算法模型

SSD 的网络模型基于一个前馈卷积网络,大概可以分为两个部分:一个是前端的特征提取网络,使用一个去除了全连接层的分类网络,可以是AlexNet[15],VGG[16]等,本文使用的是VGG网络;另一个是添加在后面的多尺度特征检测网络,通过池化操作将前面网络产生的特征图尺寸逐层减小,然后再用不同卷积层的多个特征图预测物体分类以及目标边界框的偏移,最后使用最大值抑制方法(Non Maximum Suppression,NMS)产生最终的检测结果,实现多个尺度特征图的检测。SSD 框架如下图2-4所示。

 

  • 2
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值