![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
DETR系列
文章平均质量分 76
libo-coder
DeepLearning / Computer Vision / OCR
展开
-
DINO-DETR
原始的 DETR 使用全零初始化 object query,导致模型优化困难,而 Anchor DETR 采用了 anchor points 来编码形成 object query,保证每个 query 关注 points 附近的特征,相当于为 querys 提供了明确的优化方向。PnP-DETR(ICCV 2021) 改进了 DETR 计算量大的问题,利用提出的 poll and pool(PnP)采样模块在图像特征上自适应的采样不同粒度的特征,从而实现计算量和性能的折衷。原创 2024-06-22 22:12:52 · 524 阅读 · 0 评论 -
DAB-DETR
Focus:原创 2024-06-20 22:19:21 · 343 阅读 · 0 评论 -
DN-DETR
匈牙利算法匹配的离散性和模型训练的随机性,导致 ground-truth 的匹配变成了一个动态的、不稳定的过程。DETR 在训练早期阶段,对于同一张图像的同一个物体,在不同 epoch 之间每个 object_query 会匹配到不同 gt(包括背景)。原因是匈牙利匹配中代价矩阵鲁棒性差,即稍微扰动就会影响匹配结果。故作者考虑额外引入加微弱噪声的gt,让额外的 object query 学习这部分gt,进而来克服不稳定的匹配过程。原创 2024-06-21 21:38:40 · 746 阅读 · 0 评论 -
Deformable-DETR
对于特征图的每一个位置会生成参考点(reference point),并且通过 Query 来生成相应的 sampling offsets,图中的是每一个点会生成三个 offsets 代 表由三个偏移点来计算出这个点的特征值,而这三个偏移点的权重也是由 Query 生成的 (Attention Weights)。从这里看到其中没有涉及矩阵乘法,因 此和 image 的尺寸是成线性关系的。原创 2024-06-19 22:32:36 · 380 阅读 · 0 评论 -
DETR开篇之作
DETR是一种基于Transformer的端到端物体检测方法,通过直接预测图像中的物体边界框和类别标签,简化了传统的检测流程。原创 2024-06-16 21:11:44 · 113 阅读 · 0 评论