别再双塔了！谷歌提出DSI索引，检索效果吊打双塔，零样本超BM25！

夕小瑶

于 2022-02-21 11:55:00 发布

阅读量1.7k

点赞数

文章标签：机器学习人工智能深度学习 java 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xixiaoyaoww/article/details/123059405

版权

卖萌屋今日学术精选

这篇论文展示了信息检索可以用一个Transformer来完成，其中，关于语料库的所有信息都被编码在Transformer模型的参数中。

论文标题：
Transformer Memory as a Differentiable Search Index
链接：
https://arxiv.org/abs/2202.06991

作者提出了可微搜索索引（Differentiable Search Index，DSI)的概念，这是一种新的搜索范式，它可以学习出一个Query-to-DocID的文本检索模型，将用户Query直接映射到相关的DocID节点上；换句话说，DSI模型直接使用其模型参数来回答用户查询，极大地简化了整个检索过程。

上图展示了经典的双塔模型（Dual Encoder）+最大内积检索（MIPS）的经典检索范式，与本文提出的可微搜索索引（DSI）的范式的区别。后者统一了模型的训练与检索。

实验结果

首先作者在不同规模的NQ数据集上，检验了DSI模型的supervised learning能力。

从上表可以看到，DSI模型经过finetune之后，强势吊打了BM25基线和同样finetune之后的T5模型。

此外，作者还在NQ数据集上检验了DSI模型的zero-shot能力。

众所周知，BM25是zero shot方面非常高的一个基线，从上表可以看出，DSI的zero shot能力也显著优于BM25。

实验表明，给定适当的设计选择，DSI不仅显著优于双塔模型为代表的强基线模型，此外，DSI展示了很强的泛化能力，在zero-shot实验中显著优于BM25基线。

后台回复关键词【入群】

加入卖萌屋NLP/IR/Rec与求职讨论群

后台回复关键词【顶会】

获取ACL、CIKM等各大顶会论文集！

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
别再双塔了！谷歌提出DSI索引，检索效果吊打双塔，零样本超BM25！

卖萌屋今日学术精选这篇论文展示了信息检索可以用一个Transformer来完成，其中，关于语料库的所有信息都被编码在Transformer模型的参数中。论文标题：Transformer M...
复制链接

扫一扫

夕小瑶 CSDN认证博客专家

CSDN认证企业博客

1029: 原创

9630: 周排名

488: 总排名

278万+: 访问

: 等级

2万+: 积分

8755: 粉丝

8943: 获赞

358: 评论

1万+: 收藏

私信

关注

热门文章

分类专栏

最新评论

大模型时代的蓝海任务，GPT4V准确率不足10%，港科大发布指代理解基准RefCOCO
穷苦书生_万事愁: 博主的这篇文章真是开拓了我的视野，让我对“大模型时代的蓝海任务，GPT4V准确率不足10%，港科大发布指代理解基准RefCOCO”这个主题有了全新的认识。文章中的细节描写非常精准，让我对这个复杂的话题有了更深入的理解。博主的专业知识和丰富经验在文中得到了充分展现，让我对博主的功底感到由衷的佩服。期待博主未来能够继续分享更多类似的高质量文章，同时也希望能够得到博主的指导，共同进步。非常感谢博主无私的分享和支持！
pytorch可视化教程：训练过程+网络结构
冰红茶很好喝: 谢谢！！！
奥特曼个人投资引纠纷，手持400多家公司28亿美元，部分投资与OpenAI有利益冲突！
m0_74438464: 老板，办的会员登录不上了，速速来帮我解决下
pytorch可视化教程：训练过程+网络结构
nailixiaomianbao: 作者你好，我在最后得到了localhost地址后在本地浏览器上显示拒绝链接这个该怎么解决呢
NLP领域的首次Hard Label黑盒攻击！
晓姿寒轩: 请问为何说攻击的细粒度不够呢？？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。