目标检测模型介绍

最新推荐文章于 2024-06-06 20:33:25 发布

堪忧的点灯人

最新推荐文章于 2024-06-06 20:33:25 发布

阅读量175

点赞数

文章标签：目标检测计算机视觉

本文链接：https://blog.csdn.net/herolevel/article/details/132253663

版权

目标检测模型介绍

一、简介

目标检测（Object Detection）的任务是找出图像中所有感兴趣的目标（物体），确定它们的类别和位置，是计算机视觉领域的核心问题之一。由于各类物体有不同的外观、形状和姿态，加上成像时光照、遮挡等因素的干扰，目标检测一直是计算机视觉领域最具有挑战性的问题。
接下来我将介绍几个目标检测模型，它们分别是：

YOLOv7
CenterNet
DETR
Cascade R-CNN

二、模型介绍

1.YOLOv7

yolov7由yolov4原版人马打造，试图将yolo算法打造的更快，更好！同时能够支持边缘到云端的移动GPU设备。作者号称YOLOv7 在 5 FPS 到 160 FPS 范围内，速度和精度都超过了所有已知的目标检测器，并在 GPU V100 上，30 FPS 的情况下达到实时目标检测器的最高精度 56.8% AP。YOLOv7 是在 MS COCO 数据集上从头开始训练的，不使用任何其他数据集或预训练权重。（具体详情可参考知乎的这篇文章）

2.CenterNet

CenterNet是一个基于Anchor-free的目标检测算法，该算法是在CornerNet算法的基础上改进而来的。与单阶段目标检测算法yolov3相比，该算法在保证速度的前提下，精度提升了4个百分点。与其它的单阶段或者双阶段目标检测算法相比，该算法具有以下的优势：

（1）该算法去除低效复杂的Anchors操作，进一步提升了检测算法性能；
（2）该算法直接在heatmap图上面执行了过滤操作，去除了耗时的NMS后处理操作，进一步提升了整个算法的运行速度；
（3）该算法不仅可以应用到2D目标检测中，经过简单的改变它还可以应用3D目标检测与人体关键点检测等其它的任务中，即具有很好的通用性。
（CenterNet算法的详解可点击此链接）

3.DETR

DETR是第一个将Transformer应用到目标检测的算法。在DETR中，它的Encoder可以看做一个编码器，图像经过由CNN和Transformer组成的解码器之后，将图像编码成一个特征向量。然后解码器通过对输入特征和不同的object queries得到不同的解码的特征向量。最后通过将这个解码的特征向量输入到MLP中得到
个不同的bounding box的坐标和类别。从上面角度看DETR也可以应用到其它任务中，它只需要根据不同的任务使用不同输出结果的MLP即可。
（想看详情请点此链接）

4.Cascade R-CNN

Cascade R-CNN 是一种目标检测架构，旨在通过增加 IoU 阈值来解决性能下降的问题（由于训练期间的过度拟合以及最佳检测器与输入之间的 IoU 之间的推理时间不匹配）。它是 R-CNN 的多级扩展，其中级联更深处的检测器级依次对接近的误报更具选择性。 R-CNN 级联级联按顺序进行训练，使用一个阶段的输出来训练下一个阶段。这是由于观察到回归器的输出 IoU 几乎总是优于输入 IoU。Cascade R-CNN 的目的不是挖掘硬负例。相反，通过调整边界框，每个阶段的目标是找到一组良好的接近误报来训练下一阶段。当以这种方式操作时，适应越来越高的 IoU 的一系列检测器可以克服过度拟合问题，从而得到有效的训练。在推理时，应用相同的级联过程。逐步改进的假设与每个阶段不断提高的探测器质量更好地匹配。
（详细介绍请点击此链接查看）