自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 用于图像恢复的图像层次结构的高效和显式建模Efficient and Explicit Modelling of Image Hierarchies for Image Restoration

图像恢复旨在从低质量图像中恢复高质量图像,这些图像是由图像退化过程(如模糊、子采样、噪声干扰和JPEG压缩)引起的。图像恢复是一个不适定逆问题,因为在图像退化过程中,有关图像的重要内容信息丢失。因此,为了恢复高质量的图像,应该充分利用退化图像中表现出的丰富信息。自然图像包含全局、区域和局部范围的特征层次,深度神经网络可以使用这些特征进行图像恢复。首先,局部范围覆盖几个像素,典型特征是边缘和局部颜色。为了对这些局部特征进行建模,使用了具有小内核(例如3×3)的卷积神经网络。

2023-03-21 16:52:58 1803 3

原创 Team-DETR:作为检测变压器专业团队指导查询

许多后续工作致力于提高查询的可预测性。一个查询现在被分离为一个内容和一个单独的空间[14]。空间查询被建模为锚点[14,15]或锚框[16],在训练期间不断更新。然而,目前的工作只给查询一个明确的物理含义。查询通常负责不同规模和位置的对象。这对查询本身来说是一个挑战,而且查询之间还会存在空间资源竞争。在本文中,我们致力于作为一个专业团队有效地指导Queries。在不增加参数和计算的情况下,我们通过在规模和空间方面为查询分配函数来加强查询之间的分工.图1:具有不同锚框比例的查询的预测框分布。

2023-03-05 17:39:37 118

原创 HYNETER:用于对象检测的混合网络转换器

卷积神经网络(CNN)多年来一直主导计算机视觉建模。随着越来越大的神经网络和逐渐复杂的协同进化结构的帮助,近年来,性能得到了显著的改善。然而,学者们关注的是更大的模型大小、更多样的卷积核和更复杂的网络结构,这导致了总体性能的进步,模型大小不成比例。另一方面,Transformer在视觉任务方面取得了巨大进展,这源于自然语言处理(NLP)。Transformer专为序列建模和转导任务而设计,以其关注特征中的全局依赖性而闻名。

2023-03-05 16:11:05 132

原创 KS-DETR学习笔记

缩放点积注意力对查询和键的缩放点积应用softmax函数来计算权重,然后将权重和值相乘。在这项工作中,我们研究了如何改进scaleddot产品注意力的学习,以提高DETR的准确性。我们的方法基于以下观察:使用地面真实前景背景掩码(GT-Fg-BgMask)作为权重/值中的附加线索,可学习者学习更好的权重/值;使用更好的权重/值,可以学习更好的值/权重。

2023-02-24 15:54:35 329

原创 SAM-DETR学习笔记Accelerating DETR Convergence via Semantic-Aligned Matching

SAM-DETR论文

2023-02-10 17:30:52 945 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除