基于文本的人物检索:CLIP-based Synergistic Knowledge Transfer for Text-based Person Retrieval
4)方法:本文引入了基于CLIP的协同知识传递(CSKT)方法,具体包括Bidirectional Prompts Transferring (BPT)模块和Dual Adapters Transferring (DAT)模块。5)结果:CSKT在三个基准数据集上优于现有方法,而训练参数仅占整个模型的7.4%,表明其具有显著的效率、有效性和泛化能力。3)背景:文本检索中的人物检索面临着视觉和语言模态之间的巨大差距,尤其是在处理有限的大规模数据集时。
原创
2023-09-20 09:39:53 ·
329 阅读 ·
3 评论