Single shot object detection SSD using MobileNet and OpenCV

最新推荐文章于 2021-03-11 12:54:38 发布

这里什么都没有、这里什么又都有

最新推荐文章于 2021-03-11 12:54:38 发布

阅读量339

点赞数 1

分类专栏： opencv+python计算机视觉深度学习

本文链接：https://blog.csdn.net/Ewing_yy/article/details/106769150

版权

本文介绍了使用深度学习、MobileNet和OpenCV进行单发目标检测（SSD）的方法，包括物体检测的概念、不同检测方法的比较，重点讲述了为何在SSD中选择MobileNet。此外，还提供了项目的版本信息、结构和相关代码链接。

摘要由CSDN通过智能技术生成

微信公众号：小白图像与视觉

关于技术、关注yysilence00。有问题或建议，请公众号留言。

主题：Single shot object detection SSD using MobileNet and OpenCV

①版本：opencv3.4.1 numpy imutils

②模型参数将其放置在model_data /中

③项目结构：

1、引言

在本节中，我们将使用深度学习，MobileNet和OpenCV对单发目标检测（SSD）进行实用概述。对象检测是计算机视觉领域最热门的话题。对象检测正在进入广泛的行业，其用例范围从人身安全到工作场所的生产力。对象检测和识别已应用于计算机视觉的许多领域，包括图像检索，安全性，监视，自动车牌识别，光学字符识别，交通控制，医疗领域，农业领域等等。

2、什么是物体检测

在“对象检测”中，我们对图像进行分类，并确定对象在图像中的位置。为此，我们必须获得边界框，即图像的（x，y）坐标。帧检测被视为回归问题。单镜头检测（SSD）是物体检测的方法之一。

3、各种物体检测方法

每当我们谈论对象检测时，我们主要讨论这些主要的检测方法。

Faster RCNN
You look only once (YOLO)
Single-shot detection

A:
FasterRCNN对各个区域执行检测，然后最终对图像中的各个区域进行多次预测。它的速度从每秒5到7帧不等。

B:
还有另一种类型的检测，称为YOLO对象检测，在计算机视觉的实时对象检测器中非常流行。它的架构类似于Faster RCNN。YOLO在训练和测试期间会看到整个图像，因此它隐式地编码有关类及其外观的上下文信息。简而言之，我们将图像通过Faster RCNN网络传递一次并输出其主要预测。
YOLO的属性

它的处理速度为每秒45帧，比实时检测要好。
与RCNN相比，它产生的背景错误更少。
YOLO在训练数据集上使用k-means聚类策略来确定那些默认边界框。
YOLO的主要问题在于，仍然有很多精度不足。

C:
SSD单次拍摄对象检测或SSD拍摄一次即可检测图像中的多个对象.
它由两部分组成

提取特征图
应用卷积过滤器检测对象
SSD是由Google研究人员团队开发的，旨在平衡YOLO和RCNN这两种对象检测方法之间的平衡。

具体来说，有两种型号的SSD可用:

SSD300：在此型号中，输入大小固定为300×300。它用于较低分辨率的图像，更快的处理速度，并且精度不如SSD512
SSD512：在此型号中，输入大小固定为500×500。它用于更高分辨率的图像，并且比其他模型更准确。
SSD比R-CNN快，因为在R-CNN中，我们需要两次拍摄，一个用于生成区域建议，一次用于检测对象，而在SSD中，它可以一次完成。

首先在COCO数据集上训练MobileNet SSD方法，然后在PASCAL VOC上进行微调，达到72.7％mAP（平均平均精度）。

例如-在Pascal VOC 2007数据集中，SSD300的mAP为79.6％，SSD512的mAP为81.6％，这比R-CNN的78.8％mAP快。

我们正在使用MobileNet-SSD（这是MobileNet-SSD检测网络的Caffe实现，其VOC0712和mAP = 0.727上的权重经过预先训练）。

VOC0712是用于对象类别识别的图像数据集，而mAP（平均精度）是用于对象识别的