DETR系列文章之–Grounding DINO 文章目录 DETR系列文章之–Grounding DINO 前言 一、整体框架 二、详细结构 1.特征提取与融合 2.Language-Guided Query Selection 3.Cross-Modality Decoder 4.Sub-Sentence Level Text Feature 5.损失函数 总结 前言 Grounding DINO,一种开集目标检测方案,基于Transformer的检测器DINO与GT预测相结合。双encoder单decoder融合了text和image信息。 论文下载 代码下载 CSDN解说 一、整体框架 Grounding DINO,是一个双encoder单decoder的架构