【CVPR2024】文本到图像的行人再识别中的噪声对应学习

向向2024

已于 2024-04-22 14:43:14 修改

阅读量374

点赞数

分类专栏： CVPR2024 行人重识别文章标签：学习深度学习人工智能论文阅读

于 2024-04-22 14:42:55 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_49090702/article/details/138075930

版权

CVPR2024 同时被 2 个专栏收录

6 篇文章 1 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

行人重识别

3 篇文章 0 订阅

订阅专栏

这篇论文的标题是《Noisy-Correspondence Learning for Text-to-Image Person Re-identification》，作者是来自中国四川大学、英国诺森比亚大学、新加坡A*STAR前沿人工智能研究中心和高性能计算研究所的研究人员。论文主要研究了文本到图像的行人再识别（Text-to-Image Person Re-identification, TIReID）问题，这是一个在跨模态领域中具有挑战性的话题，目标是基于文本查询检索目标人物的图像。
在这里插入图片描述

主要贡献和创新点：

问题揭示：论文揭示了TIReID中的一个新的普遍问题，即噪声对应（Noisy Correspondence, NC）。与类别级别的噪声标签不同，NC指的是图像-文本对中的错误的对应关系，这可能会误导模型学习错误的视听语义关联。
鲁棒方法：提出了一种名为鲁棒双嵌入（Robust Dual Embedding, RDE）的方法，通过提出的Confident Consensus Division (CCD)机制和新颖的Triplet Alignment Loss (TAL)来减轻NC的不利影响。CCD通过融合双重粒度决策来将训练数据一致性地划分为干净和噪声集合，从而为鲁棒学习提供更可靠的对应关系。
实验验证：在三个公开的图像-文本行人基准数据集上进行了广泛的实验，验证了RDE的性能和鲁棒性。RDE在所有三个数据集上均取得了最佳性能ÿ

了解本专栏

超级会员免费看

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
【CVPR2024】文本到图像的行人再识别中的噪声对应学习

论文主要研究了文本到图像的行人再识别（Text-to-Image Person Re-identification, TIReID）问题，这是一个在跨模态领域中具有挑战性的话题，目标是基于文本查询检索目标人物的图像。
复制链接

扫一扫

专栏目录

向向2024 CSDN认证博客专家 CSDN认证企业博客

码龄4年

25: 原创

117万+: 周排名

4万+: 总排名

2万+: 访问

: 等级

583: 积分

247: 粉丝

330: 获赞

6: 评论

326: 收藏

私信

关注

热门文章

分类专栏

最新评论

CVC-ClinicDB（Colorectal Cancer-Clinic Dataset）数据集介绍
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
【ISBI2024】Language Grounded Single Source Domain Generalization in Medical Image Segmentation
୧⍤⃝238: 请问又论文下载链接吗
【2024综述】域泛化-Domain Generalization for Medical Image Analysis
CSDN-Ada助手: 恭喜您撰写第10篇博客，“【2024综述】域泛化-Domain Generalization for Medical Image Analysis”！您对医学图像分析领域的研究深入且详实，为读者提供了宝贵的知识和见解。希望您能继续保持创作的热情和努力，探索更多领域泛化在医学图像分析中的潜力。或许您可以考虑加入一些实际案例或应用场景，以使您的研究更具实用性和可操作性。期待您未来更多精彩的作品！
【2024】QKFormer: Hierarchical Spiking Transformer using Q-K Attention
CSDN-Ada助手: 恭喜您发布第8篇博客！看到您探讨“QKFormer: Hierarchical Spiking Transformer using Q-K Attention”这一主题，非常有深度和前瞻性。建议在下一步的创作中，可以进一步探讨该模型在不同任务上的应用和效果，或者结合其他前沿技术进行深入研究。期待您的更多精彩内容！祝您创作顺利！
【2024】VLM-CPL：无注释的病理图像分类！来自视觉语言模型的共识伪标签
CSDN-Ada助手: 恭喜您在博客领域持续创作，标题中的VLM-CPL技术听起来非常有趣！希望能够看到更多关于这一领域的深入研究和应用案例。不过，或许在下一篇博客中可以加入一些案例分析或实验结果，以便更好地展示您的研究成果和观点。期待您的下一篇作品！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

向向2024 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。