Pistis-RAG：一种新的RAG框架

lichunericli

已于 2024-07-19 14:03:59 修改

阅读量488

点赞数 10

文章标签：人工智能深度学习

于 2024-07-19 14:03:33 首次发布

本文链接：https://blog.csdn.net/lichunericli/article/details/140547723

版权

Pistis-RAG: A Scalable Cascading Framework Towards Trustworthy Retrieval-Augmented Generation

在希腊神话中，Pistis 代表诚信与信任，与 LLM 系统中 RAG 的核心理念相契合。Pistis-RAG 框架通过多阶段设计，有效应对大规模 RAG 挑战。各阶段分工明确：匹配精炼搜索范围，预排序聚焦语义相关文档，排序则迎合 LLM 偏好。推理与聚合阶段更支持复杂思维链方法的实施。我们指出，LLM 与外部知识排序间的弱关联，源于 RAG 框架的模型中心倾向。而内容中心策略则强调 LLM 与外部信息的无缝融合，优化任务特定内容转换。我们的排序阶段创新性地认识到，仅凭语义相关性未必能提升生成质量，这一洞察基于少数样本提示顺序的敏感性。为此，我们设计了专为 RAG 系统定制的排序阶段，兼顾信息检索原则与 LLM 偏好及用户反馈。通过整合上下文学习与推理步骤，确保用户反馈的有效融入，实现高效对齐。MMLU 基准测试显示性能提升 9.3%，模型与代码将开源。大规模实际数据实验证实了框架的可扩展性。

https://arxiv.org/abs/2407.00072

1. 背景

传统RAG架构面临两个主要问题：

• 一是准确检索相关知识
• 二是在生成质量和计算效率之间找到平衡点

此外，将检索到的信息与LLM生成的输出整合起来，需要考虑诸如语义对齐、提示工程和用户偏好等多个因素，仍是一个复杂的任务。传统的RAG方法可能未能充分考虑LLMs处理和优先级信息的细节，导致在实际应用中表现不佳。

今天这篇论文提出了Pistis-RAG这一创新框架，解决了检索增强生成中的关键挑战，提升了效率和效果。Pistis-RAG采用了包含匹配、预排名、排名和重排名的多阶段检索流程。框架采用了以内容为中心的方法，确保检索到的信息与用户需求和LLM能力完美对接

2. 以内容为中心 vs 以模型为中心

Pistis-RAG与其他RAG最大的区别在于，Pistis-RAG是以内容为中心，传统RAG是以模型为中心。下图展示了传统RAG的以模型为中心的架构设计：

这类架构设计从类似LangChain 以模型为中心的视角来看：突出了模型在执行任务时的核心作用，重点放在了模型自身的强大功能上，而不仅仅局限于内容的流转和变化过程。

Pistis-RAG的核心是以内容为中心，如下图所示：

以内容为中心的视角将任务视为内容形态的转变过程，流程包括：

• 内容获取：根据用户意图从外部知识库获得信息，确保检索到的内容与用户意图任务相吻合。
• 内容转换与融合：结合检索到的内容和模型的能力，为用户需求生成新内容提供指导，可能包括：指令、摘要等。
• 内容呈现：生成新的内容，呈现给用户。

以内容为导向的视角，体现了外部知识在整个过程中的核心地位，其中长期记忆是该系统的主要输入源，推动整个内容转换生产流水线的运作。

3. 什么是Pistis RAG？

Pistis-RAG是一种多阶段级联检索与生成框架（Multi-Stage Cascading Retrieval and Generation）该框架包含五个关键步骤：匹配、排名、重排、推理和聚合。匹配阶段，检索算法精准挑选与库中相关的文档；排名阶段，通过语义分析进一步优化文档评分，确保与查询的高相关度。重排阶段调整文档排序，以符合LLM的偏好，确保响应的连贯性。推理阶段通过探索多种序列，增加了响应的多样性。最后，聚合阶段将各响应综合，以确保输出的一致性。