![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
文献阅读
文章平均质量分 95
关于深度学习-计算机视觉-目标检测的论文阅读分享
α2022
这个作者很懒,什么都没留下…
展开
-
CVPR 2023:Integrally Pre-Trained Transformer Pyramid Networks
在本文中,我们提出了一个基于掩蔽图像建模 (MIM) 的整体预训练框架。我们提倡联合预训练 backbone 和 neck,使 MIM 和下游识别任务之间的迁移差距最小。我们做出了两项技术贡献。首先,我们通过在预训练阶段插入特征金字塔来统一重建和识别颈部。其次,我们用屏蔽特征建模 (MFM) 补充屏蔽图像建模 (MIM),为特征金字塔提供多阶段监督。预训练模型称为整体预训练变压器金字塔网络 (iTPN),可作为视觉识别的强大基础模型。原创 2023-03-23 15:26:33 · 417 阅读 · 0 评论 -
文献:Revisiting Weakly Supervised Pre-Training of Visual Perception Models
模型预训练是现代视觉识别系统的一个基石。尽管在ImageNet这样的数据集上进行完全监督的预训练仍然是事实上的标准,但最近的研究表明,大规模的弱监督预训练可以胜过完全监督的方法。本文通过现代版本的残差网络和有史以来最大的图像和相应的标签数据集,重新审视了使用标签监督的弱监督预训练的模型。我们研究了所得到的模型在各种迁移学习设置中的表现,包括zero-shot迁移。我们还将我们的模型与那些通过大规模自我监督学习获得的模型进行了比较。原创 2023-03-07 11:05:27 · 206 阅读 · 0 评论