深度学习基础之 - 行人检测SSD

SSD(Single Shot MultiBox Detector)是一种高效的行人检测方法,通过多尺度特征图和预先设定的Anchor进行目标检测,解决了YOLO在小目标检测上的问题。利用数据增广和精心设计的目标函数,SSD在保持速度的同时提高了检测精度。
摘要由CSDN通过智能技术生成

       Faster-RCNN 虽然在效果上做到了 State-Of-The-Art,但效率问题无法做到实时,YOLO 在此基础上提出了改进:

一. Region Proposal

       Region Proposal 过程的优点是能够初步检测有效的 Candidate,缺点是带来效率的降低(Faster构造了两级网络)。

       YOLO去掉了 Faster的 RPN 过程,直接预测物体的种类和位置。

       这是一个里程碑似的 Idea!

 

二. 直接训练

       YOLO 将目标的分类与定位进行合并,将对应位置的信息 通过网络,对应到最后面的 7*7的格子上,每个格子对应一个30维的向量,分别代表 分类与定位信息。对应图中 30维向量 = (B*5 + C),B是每个Grid对应Bound Box数量,Paper中值为2,C为分类数,值为20。

       YOLO 网络图参考如下:

 

三. SSD 剖析

SSD全称是:Single Shot MultiBox Detector,作者是 UNC教堂山的 Wei Liu

论文下载地址:http://www.cs.unc.edu/~wliu/papers/ssd.pdf

 

1. 开山绝技 - 多尺度

     这是对YOLO最大的改进,也是本算法的核心。

     YOLO基于最后一张 Feature Map(特征图)进行提取和分类,某些细节特征的丢失导致精度下降和小目标遗漏。

    与YOLO不同的是,SSD 在多个尺度(Feature Map)上进行了回归,低层的 feature map 蕴含更多的信息,有利于细节保留 及 训练误差回传,提高了精度及小目标的适应能力。

       对于上图(b)(c)所对应 不同分辨率的 Feature Map,同样 3*3 的区域 代表了原图(a)上的目标,蓝色与红色框 的对应关系。

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值