深度学习基础之 - 行人检测SSD

最新推荐文章于 2024-08-12 14:50:42 发布

linolzhang

最新推荐文章于 2024-08-12 14:50:42 发布

阅读量1.8w

点赞数 9

分类专栏：深度学习深度学习基础文章标签：深度学习深度学习基础 SSD 目标检测行人检测

本文链接：https://blog.csdn.net/linolzhang/article/details/55281298

版权

SSD（Single Shot MultiBox Detector）是一种高效的行人检测方法，通过多尺度特征图和预先设定的Anchor进行目标检测，解决了YOLO在小目标检测上的问题。利用数据增广和精心设计的目标函数，SSD在保持速度的同时提高了检测精度。

摘要由CSDN通过智能技术生成

Faster-RCNN 虽然在效果上做到了 State-Of-The-Art，但效率问题无法做到实时，YOLO 在此基础上提出了改进：

一. Region Proposal

Region Proposal 过程的优点是能够初步检测有效的 Candidate，缺点是带来效率的降低（Faster构造了两级网络）。

YOLO去掉了 Faster的 RPN 过程，直接预测物体的种类和位置。

这是一个里程碑似的 Idea！

二. 直接训练

YOLO 将目标的分类与定位进行合并，将对应位置的信息通过网络，对应到最后面的 7*7的格子上，每个格子对应一个30维的向量，分别代表分类与定位信息。对应图中 30维向量 = （B*5 + C），B是每个Grid对应Bound Box数量，Paper中值为2，C为分类数，值为20。

YOLO 网络图参考如下：

三. SSD 剖析

SSD全称是：Single Shot MultiBox Detector，作者是 UNC教堂山的 Wei Liu

论文下载地址：http://www.cs.unc.edu/~wliu/papers/ssd.pdf

1. 开山绝技 - 多尺度

这是对YOLO最大的改进，也是本算法的核心。

YOLO基于最后一张 Feature Map（特征图）进行提取和分类，某些细节特征的丢失导致精度下降和小目标遗漏。

与YOLO不同的是，SSD 在多个尺度（Feature Map）上进行了回归，低层的 feature map 蕴含更多的信息，有利于细节保留及训练误差回传，提高了精度及小目标的适应能力。

对于上图（b）（c）所对应 不同分辨率的 Feature Map，同样 3*3 的区域 代表了原图（a）上的目标，蓝色与红色框 的对应关系。