学习论文
文章平均质量分 92
BestHammer
这个作者很懒,什么都没留下…
展开
-
HYNETER:用于对象检测的混合网络转换器
卷积神经网络(CNN)多年来一直主导计算机视觉建模。随着越来越大的神经网络和逐渐复杂的协同进化结构的帮助,近年来,性能得到了显著的改善。然而,学者们关注的是更大的模型大小、更多样的卷积核和更复杂的网络结构,这导致了总体性能的进步,模型大小不成比例。另一方面,Transformer在视觉任务方面取得了巨大进展,这源于自然语言处理(NLP)。Transformer专为序列建模和转导任务而设计,以其关注特征中的全局依赖性而闻名。原创 2023-03-05 16:11:05 · 136 阅读 · 0 评论 -
Team-DETR:作为检测变压器专业团队指导查询
许多后续工作致力于提高查询的可预测性。一个查询现在被分离为一个内容和一个单独的空间[14]。空间查询被建模为锚点[14,15]或锚框[16],在训练期间不断更新。然而,目前的工作只给查询一个明确的物理含义。查询通常负责不同规模和位置的对象。这对查询本身来说是一个挑战,而且查询之间还会存在空间资源竞争。在本文中,我们致力于作为一个专业团队有效地指导Queries。在不增加参数和计算的情况下,我们通过在规模和空间方面为查询分配函数来加强查询之间的分工.图1:具有不同锚框比例的查询的预测框分布。原创 2023-03-05 17:39:37 · 121 阅读 · 0 评论 -
KS-DETR学习笔记
缩放点积注意力对查询和键的缩放点积应用softmax函数来计算权重,然后将权重和值相乘。在这项工作中,我们研究了如何改进scaleddot产品注意力的学习,以提高DETR的准确性。我们的方法基于以下观察:使用地面真实前景背景掩码(GT-Fg-BgMask)作为权重/值中的附加线索,可学习者学习更好的权重/值;使用更好的权重/值,可以学习更好的值/权重。原创 2023-02-24 15:54:35 · 341 阅读 · 0 评论 -
SAM-DETR学习笔记Accelerating DETR Convergence via Semantic-Aligned Matching
SAM-DETR论文原创 2023-02-10 17:30:52 · 971 阅读 · 2 评论