基于文本的人物检索（TPR）DM-Adapter: Domain-Aware Mixture-of-Adapters for Text-Based Person Retrieval

Qing_er爱吃山竹

于 2025-03-20 09:33:56 发布

阅读量251

点赞数 5

文章标签：基于文本的人物检索

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Qing__er/article/details/146388129

版权

论文作者：Yating Liu,Zimo Liu,Xiangyuan Lan,Wenming Yang,Yaowei Li,Qingmin Liao

作者单位：Shenzhen International Graduate School, Tsinghua University;Pengcheng Laboratory;Peking University;Pazhou Laboratory (Huangpu),

论文链接：http://arxiv.org/abs/2503.04144v1

内容简介：

1）方向：基于文本的人物检索（TPR）

2）应用：基于文本的人物检索（TPR）

3）背景：尽管基于视觉-语言预训练的CLIP模型在人物领域的应用引起了广泛关注，但在微调过程中仍然存在一些挑战：（i）以往在TPR任务中进行全模型微调计算开销大，且容易导致过拟合；（ii）现有的参数高效迁移学习（PETL）方法缺乏细粒度特征提取。

4）方法：为了解决上述问题，本文提出了域感知适配器混合模型（DM-Adapter），将专家混合模型（MOE）与PETL结合，增强了细粒度特征表示，同时保持了高效性。具体而言，稀疏适配器混合模型（Sparse Mixture-of-Adapters）并行设计在视觉和语言分支的MLP层中，不同的专家分别专注于人物知识的不同方面，能够更细致地处理特征。为了促进路由器有效利用领域信息并缓解路由不平衡，进一步开发了域感知路由器，通过构建新的门控函数并注入可学习的域感知提示来实现。

5）结果：广泛的实验结果表明，DM-Adapter在性能上超过了以往的方法，并在多个指标上取得了最先进的成果，显著提高了基于文本的人物检索效果。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Qing_er爱吃山竹 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。