CIKM2023 | 突破双塔: 生成式交互的向量化召回

TLDR: 本文介绍了一种突破传统的双塔式(two-tower)模型的新方法,这种方法利用一个轻量级的生成模型提取一侧(例如文档侧)的特征,并模拟生成另一侧(例如查询侧)的特征。这种模型的优点在于,它实现在底层进行特征交叉,而不仅仅是在顶层进行内积。效果显著,同时Serving效率与纯双塔模型持平。此研究相当于进一步扩展了双塔式模型中引入交叉特征的可能性,并展望了在召回侧引入交叉特征的新做法。

论文:arxiv.org/abs/2306.02371 代码:github.com/Deriq-Qian-Dong/III-Retriever

回顾

从dense retrieval任务说起,主要范式有这么几种,一种是双塔(DSSM)、一种是单塔(convKNRM),一种是双塔+迟交互(poly-encoder, colBERT)。这里只列了一些经典工作,具体可以看人大的一篇[survey]-(https://arxiv.org/pdf/2211.14876.pdf)。

众所周知,单塔采用全交互方式效果好,但是没法适配向量化召回的框架,也就是无法离线建向量索引,需要实时过模型算分数。而双塔虽然能适配该框架,但是无法做到q侧和d侧的细粒度交互,效果弱于单塔。colBERT这类工作则属于

  • 16
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值