强烈推荐 | 基于飞桨的五大目标检测模型实战详解

最新推荐文章于 2024-10-08 07:30:00 发布

kasdfu

最新推荐文章于 2024-10-08 07:30:00 发布

阅读量834

点赞数 1

本文链接：https://blog.csdn.net/kasdfu/article/details/103797707

版权

本文详细介绍了基于飞桨平台的五大目标检测模型：SSD、Faster R-CNN、Mask R-CNN、YOLO v3和PyramidBox。这些模型在安防、医学图像、交通等领域有广泛应用。SSD是单阶段检测器，Faster R-CNN通过RPN生成候选区域，Mask R-CNN实现像素级别检测，YOLO v3平衡速度与精度，PyramidBox擅长小脸、模糊和遮挡的人脸检测。各模型在WIDER FACE等数据集上表现出色。

摘要由CSDN通过智能技术生成

机器视觉领域的核心问题之一就是目标检测（object detection），它的任务是找出图像当中所有感兴趣的目标（物体），确定其位置和大小。对于人类来说，目标检测是一个非常简单的任务。然而，计算机能够“看到”的是图像被编码之后的数字，很难解图像或是视频帧中出现了人或是物体这样的高层语义概念，也就更加难以定位目标出现在图像中哪个区域。

与此同时，由于目标会出现在图像或是视频帧中的任何位置，目标的形态千变万化，图像或是视频帧的背景千差万别，诸多因素都使得目标检测对计算机来说是一个具有挑战性的问题。百度自研的深度学习平台飞桨（PaddlePaddle）开源了用于目标检测的一系列模型，从而可以快速构建强大的应用，满足各种场景的应用，包括但不仅限于安防监控、医学图像识别、交通车辆检测、信号灯识别、食品检测等等。

项目地址：

https://github.com/PaddlePaddle/models/tree/v1.4/PaddleCV

经典的单阶段的目标检测器SSD

Single Shot MultiBox Detector (SSD) 是一种单阶段的目标检测器。与两阶段的检测方法不同，单阶段目标检测并不进行区域推荐，而是直接从特征图回归出目标的边界框和分类概率。SSD 运用了这种单阶段检测的思想，并且对其进行改进：在不同尺度的特征图上检测对应尺度的目标。

如下图所示，SSD 在六个尺度的特征图上进行了不同层级的预测。每个层级由两个3x3卷积分别对目标类别和边界框偏移进行回归。因此对于每个类别，SSD 的六个层级一共会产生 38x38x4 + 19x19x6 + 10