文本检索
文章平均质量分 92
gggggg159753asda
gg
展开
-
Dense Text Retrieval based on Pretrained Language Models: A Survey 上
文本检索旨在查找相关信息资源(例如,文件或段落)以响应用户查询。它是指查询和资源以自然语言文本的形式存在的特定信息检索场景。作为克服信息过载的关键技术之一,文本检索系统已经被广泛地应用于许多下游应用,包括问答[1]、[2]、对话系统[3]、[4]、实体链接[5]、[6]和Web搜索[7]等。本部分首先介绍了稠密文本检索的背景,然后讨论了设计稠密检索模型的关键问题。原创 2023-11-08 21:32:36 · 411 阅读 · 0 评论 -
Semantic Models for the First-stage Retrieval: A Comprehensive Review 2021
大规模查询文档检索是搜索系统中的一个关键问题,例如 Web 搜索引擎,其目的是在给定用户查询的情况下从大型文档存储库中返回一组相关文档。为了平衡搜索效率和有效性,现代搜索系统在实践中通常采用多阶段排序管道,如图1所示。第一阶段检索旨在通过一些专门设计的索引结构辅助的更便宜的排名模型从大型存储库中返回初始候选文档集。之后,几个重新排序阶段采用更复杂和有效的排名模型来修剪和改进前一阶段输出的排序列表。原创 2023-11-08 15:04:49 · 85 阅读 · 0 评论 -
A Survey on Retrieval-Augmented Text Generation. 2022
检索增强文本生成作为一种新的文本生成范式,融合了新兴的深度学习技术和传统的检索技术,在许多NLP任务中取得了最先进的(SOTA)性能,并引起了计算语言学界的关注(Weston等人,2018;与基于生成的模型相比,这种新范式具有显著的优势:1)知识不需要隐式存储在模型参数中,而是以即插即用的方式显式获取,具有很大的可扩展性;2)该范式不是从零开始生成文本,而是从一些检索到的人类书面参考中生成文本,这可能会减轻文本生成的难度。原创 2023-11-07 14:59:55 · 137 阅读 · 0 评论 -
Improving Passage Retrieval with Zero-Shot Question Generation
我们提出了一种简单有效的重新排序方法来提高开放式问答中的段落检索。重新排序器使用零样本问题生成模型对检索到的段落进行重新排序,该模型使用预训练的语言模型来计算以检索到的段落为条件的输入问题的概率。这种方法可以应用于任何检索方法(例如基于神经或关键字)之上,不需要任何特定领域的训练(因此有望更好地推广到数据分布变化),并在查询和段落之间提供丰富的交叉注意力(即它必须解释问题中的每个标记)。原创 2023-11-06 22:15:19 · 181 阅读 · 0 评论