![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
行人重识别
文章平均质量分 89
向向2024
计算机视觉、多模态学习、大语言模型、医学图像分析、Diffusion 模型等,带你天天读论文
展开
-
【CVPR2024】文本到图像的行人再识别中的噪声对应学习
论文主要研究了文本到图像的行人再识别(Text-to-Image Person Re-identification, TIReID)问题,这是一个在跨模态领域中具有挑战性的话题,目标是基于文本查询检索目标人物的图像。原创 2024-04-22 14:42:55 · 454 阅读 · 0 评论 -
Frequency Domain Nuances Mining for Visible-Infrared Person Re-identification
本文提出了一种新颖的频域细微差异挖掘方法,用于可见-红外人员再识别任务。通过在频域中探索交叉模态的频域信息,该方法有效地减小了可见光和红外图像之间的模态差异,并在多个数据集上取得了显著的性能提升。原创 2024-03-19 21:09:10 · 999 阅读 · 0 评论 -
【CVPR2024】 EDITOR Magic Tokens: Select Diverse Tokens for Multi-modal Object Re-Identification
单模态对象重新识别(ReID)在复杂视觉场景中保持鲁棒性面临巨大挑战。相比之下,多模态对象ReID利用了来自不同模态的互补信息,显示出在实际应用中巨大的潜力。然而,以前的方法可能容易受到无关背景的影响,并且通常忽略模态间的差距。为了解决上述问题,我们提出了一种新颖的学习框架EDITOR,用于从视觉Transformer中为多模态对象ReID选择多样的标记。我们首先使用共享视觉Transformer从不同的输入模态中提取标记化特征。原创 2024-03-18 13:54:21 · 1006 阅读 · 0 评论