![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Object Detection
文章平均质量分 96
检测图片中的目标,识别目标类别并框出位置。
Fulin_Gao
主要研究方向包括开放集识别(Open-Set Recognition)、开放世界识别(Open-World Recognition)、增量学习(Incremental Learning)、新类别发现(Novel Category Discovery)、少样本学习(Few-Shot Learning)
展开
-
【开放集目标检测】Grounding DINO
Grounding DINO:该方法融合了文本和图像两个模态的数据,实现了开放集目标检测,即给定一个文本提示,自动框出目标所在,该目标可以是训练集中没有的类别。该方法主要通过特征增强模块、语言指导查询选择模块、跨模态解码模块实现上述功能。原创 2024-07-07 22:40:14 · 897 阅读 · 1 评论 -
【目标检测】DINO
DINO:提出对比去噪训练方法,相比原DN-DETR中的去噪训练方法引入了负查询来避免重复的和不期望的预测;提出混合查询选择方法,相比原Deformable DETR中的查询选择方法移除了由编码器输出初始化解码器内容查询的部分;提出向前看两层的锚框更新方法,相比原Deformable DETR中向前看一层的锚框更新方法将梯度更新扩展到了前一层。原创 2024-07-03 22:21:13 · 1485 阅读 · 1 评论 -
【目标检测】DEtection TRansformer (DETR)
DETR:无proposal(R-CNN系列)、无anchor(YOLO系列)、无NMS的、端到端的目标检测方法。原创 2024-05-02 10:40:37 · 1208 阅读 · 0 评论 -
【目标检测】Deformable DETR
Deformable DETR 提出多尺度可变形注意力 (Multi-scale Deformable Attention) 解决 DETR 收敛速度慢、特征图尺度单一等问题。原创 2024-05-06 16:34:44 · 1130 阅读 · 3 评论 -
【目标检测】DAB-DETR
DAB-DETR:将Decoder中Query的角色解耦为图像内容和物体位置,明确了DETR收敛慢的原因在于Query的物体位置部分没有提供目标位置的先验;提出输入位置先验并逐层微调的策略提升模型收敛速度,提出注意力调制方案使注意力可以适应不同形状的目标,提出缩小Sinusoidal位置编码时的Temperature使注意力时Query更加关注局部区域。原创 2024-06-23 19:27:37 · 889 阅读 · 0 评论 -
【目标检测】DN-DETR
DN-DETR: 指出DETR收敛慢的另一个主要原因为二分图匹配的不稳定性,提出对真实目标的锚框信息和标签信息施加噪声并将其喂入解码器中,使解码器进行去噪操作的训练方式。去噪部分引入了真实目标信息且不需要二分图匹配,所以有利于原始匹配部分的稳定从而加速收敛。原创 2024-06-30 18:02:28 · 1007 阅读 · 0 评论