DETR为什么不需要NMS后处理？？？

高大黑白涂鸦

已于 2024-08-27 14:23:18 修改

阅读量786

点赞数 13

文章标签：机器学习人工智能目标检测深度学习视觉检测面试

于 2024-08-27 14:22:01 首次发布

本文链接：https://blog.csdn.net/m0_56702615/article/details/141601897

版权

DETR（Detection Transformer）是一种基于Transformer的目标检测模型，它与传统的目标检测方法相比，采用了不同的处理流程。传统的目标检测算法（如YOLO、SSD、Faster R-CNN等）通常需要使用NMS（非极大值抑制，Non-Maximum Suppression）来去除冗余的边界框，而DETR则不需要这种后处理步骤。以下是DETR为何不需要NMS后处理的主要原因：

1. 全局关系建模

DETR使用了Transformer架构，能够在全局范围内建模目标之间的关系。传统的目标检测方法通常在局部（例如，YOLO的卷积核内）进行操作，容易导致多重检测。DETR通过将图像的特征表示作为整个输入序列，并通过自注意力机制（Self-Attention）对这些特征进行全局处理，从而能够有效区分不同目标之间的边界，减少了重复检测的情况。

2. 直接预测目标

DETR设计了一种直接预测目标的方式。在DETR中，模型输出固定数量的边界框预测和相应的类别标签，这些预测是通过对Transformer的输出进行解码得到的。模型的目标是预测图像中每个目标的类别和位置，并且每个预测的边界框都与一个唯一的目标关联。通过这种方式，DETR在模型内部就已进行了一定的去重处理。