知识问答之信息检索-1

Sparse Retriever

Sparse Retriever使用经典的IR方法来搜索相关文档,例如TF-IDF和BM25等,这些传统检索方法使用稀疏表示来衡量术语匹配,因此将其称为Sparse Retriever。

Yadav, V., Sharp, R., & Surdeanu, M. (2018). Sanity Check: A Strong Alignment and Information Retrieval Baseline for Question Answering. https://arxiv.org/abs/1807.01836v1
————————————————
版权声明:本文为CSDN博主「北在哪」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_43183860/article/details/121381192

 

Dense Retriever 
稀疏检索不能解决术语不匹配问题,在问题与文档相似但不存在重复术语的情况下,稀疏检索会失去效果。过去几年,随着深度模型的发展,密集的语义表示逐渐用于检索,一定程度上解决了术语不匹配的问题。根据对问题和文档的编码方式以及对其相似性进行评分的不同,现代 OpenQA 系统中的密集检索器(Dense Retriever)大致可以分为三种类型:基于表示的检索器(

Representation-based Retriever)、基于交互的检索器(Interaction-based Retriever)和表示-交互检索器(Representation-interaction Retriever),如下图所示。
————————————————
版权声明:本文为CSDN博主「北在哪」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_43183860/article/details/121381192

1)基于表示的检索器

也称为双编码器或双塔检索器,采用两个独立或共享参数的编码器(如 BERT)分别对问题和文档进行编码,并通过计算两个表示之间的单个相似度得分来估计它们的相关性。

2)基于交互的检索器

这种检索器同时将问题与文档一起输入模型,让它们之间进行令牌级的交互。

3)表示-交互检索器

将基于表示和基于交互的方法相结合,以实现高精度和高效率。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

YingJingh

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值