前沿论文解读
文章平均质量分 95
CV51
对计算机视觉中的目标检测、跟踪、分割、轻量化神经网络感兴趣
展开
-
图像分类任务ViT与CNN谁更胜一筹?DeepMind用实验证明
决定结构合理的模型的性能的最重要因素是训练时使用的计算资源和数据。尽管ViTs在计算机视觉方面的成功令人印象深刻,但没有强有力的证据表明,预训练的ViTs优于预训练的ConvNets。然而,ViTs在特定的上下文中可能具有实际的优势,例如能够跨模态使用相似的模型组件。原创 2023-10-29 23:20:09 · 314 阅读 · 0 评论 -
使用目标之间的先验关系提升目标检测器性能
今天跟大家分享阿姆斯特丹大学等提出的用于提升目标检测和实例分割性能的新方法RP-FEM,该方法将目标之间位置的先验关系融入到feature中。原创 2023-10-18 11:09:55 · 198 阅读 · 0 评论 -
港科大提出适用于夜间场景语义分割的无监督域自适应新方法
跟大家分享港科大提出的无监督域自适应夜间场景语义分割方法,该方法对夜间的动态目标和小目标做了针对性的优化。原创 2023-10-16 00:25:55 · 398 阅读 · 0 评论 -
EViT:借鉴鹰眼视觉结构,南开大学等提出ViT新骨干架构,在多个任务上涨点
今天跟大家分享南开大学和中国民航大学联合提出的一种新的Vison Transformer架构EViT,该结构是CNN和ViT的混合架构,在设计时参考了鹰眼成像的生理结构,在目标检测、实例分割等多个下游任务中表现优秀。原创 2023-10-13 11:44:02 · 378 阅读 · 0 评论 -
HSN:微调预训练ViT用于目标检测和语义分割,华南理工和阿里巴巴联合提出
作者提出了一种新的参数高效的迁移学习方法Hierarchical Side-Tuning(HST),可训练的side network利用了backbone的中间特征,并生成了用于进行预测的多尺度特性。通过实验表明,HST在不同的数据集和任务中表现优异,显著地减少了在密集预测任务中PETL与完全微调的性能差距。原创 2023-10-13 00:44:03 · 606 阅读 · 0 评论