Query Rewrite —— 基于大模型的query扩展改写，PRF（论文）

水的精神

已于 2024-02-21 17:17:49 修改

阅读量929

点赞数 5

分类专栏： ES搜索优化 RAG 文章标签： query改写 query Rewrite PRF 召回提示 LLM提升召回

于 2024-02-21 15:39:49 首次发布

本文链接：https://blog.csdn.net/star1210644725/article/details/136211666

版权

RAG 同时被 2 个专栏收录

50 篇文章 15 订阅

订阅专栏

ES搜索优化

45 篇文章 13 订阅

订阅专栏

本文介绍了一篇典型的 PRF （Pseudo-relevance feedback ）思路的论文，用于利用LLM来做query改写，提升召回率，召回效果。

论文地址：Large Language Models are Strong Zero-Shot Retriever

一、PRF的流程

如下图所示，先用原始的query，进行一次召回。然后基于找回的10条文档，喂给模型，让模型生成5个答案。然后在用模型生成的答案做我新的query再做一次召回。最终得到最终的结果。

其中与模型交互的prompt如下

Give a question “{q}” and its possible answering passages (most of these
passages are wrong) enumerated as: \n 1.{cq
1} \n 2.{cq2} \n 3.{cq3} . . .
please write a correct answering passage.

二、论文中给出的结论

图a，是第一次检索召回的top文档数据，从图上可知，召回10条数据，效果最好。

图b，是验证了每次让模型生成的答案数量。论文给出的结论是，模型每次生成5个答案，效果趋向于稳定和最高。

三、PRF的效果如何？

相比较BM25，提升了15%-20%

四、论文中提到PRF的弊端

如果第一次检索的数据质量很差，则召回效果会更差。并在论文中指出，应该更多地关注引入多种检索方法来实现多样性。从而避免引入噪音数据而影响最终的召回结果。

五、论文中提到了LLM能力对改写的影响

对比了chatGPT3.5 和chatGPT4

为了进一步验证我们的LameR是否会受益于更强的LLM，我们在LameR框架中涉及前沿LLMGPT-4，并将其应用于DL20数据集，因为它在GPT-3.5的主要评估结果不够优越。如表5所示，在应用GPT-4后，我们的检索方法取得了显著的高性能。

六、论文中对比了利用BM25召回还是用向量做召回

如下图所示，论文中给出，在PRF下，使用向量检索的召回效果，要优于Bm25的召回效果。

水的精神

关注

5
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
Query Rewrite —— 基于大模型的query扩展改写，PRF（论文）

本文介绍了一篇典型的 PRF （Pseudo-relevance feedback）思路的论文，用于利用LLM来做query改写，提升召回率，召回效果。为大家介绍PRF的主要流程，PRF的提升效果。PRF的弊端。以及不同规模的LLM对改写的效果的影响。
复制链接

扫一扫