RAG的核心流程详解：从信息检索到生成

chenwr727

已于 2024-09-09 11:40:09 修改

阅读量655

点赞数 3

分类专栏：胡言乱语文章标签：自然语言处理 RAG

于 2024-09-09 10:46:29 首次发布

本文链接：https://blog.csdn.net/chenwr_727/article/details/142053066

版权

33 篇文章

订阅专栏

RAG（Retrieval-Augmented Generation）技术将信息检索和文本生成结合起来，通过检索相关信息来提升生成模型的性能。下面是RAG的核心流程的详细解析，从输入处理到生成阶段，再到最终的输出处理。

1.1 用户输入

1.2 预处理

2.1 检索引擎

定义：用于从大型知识库或文档库中检索相关信息的技术。常用的方法包括：
- 关键词检索：如BM25算法，根据关键词的匹配程度进行检索。
- 向量检索：如BERT、DPR（Dense Passage Retrieval），将文本转换为向量并计算相似度。
过程：将用户输入传递给检索引擎，检索相关文档或片段。

2.2 返回文档

3.1 模型输入

3.2 生成答案

4.1 后处理

4.2 返回结果

以下是一个具体的RAG流程示例，帮助理解如何将上述步骤结合起来：

用户输入：用户询问“什么是量子计算？”
输入处理：系统对问题进行分词和预处理。
信息检索：
- 检索引擎：使用向量检索技术从科学文献库中检索与“量子计算”相关的文档。
- 返回文档：检索到几篇相关文献的摘要或片段。
生成阶段：
- 模型输入：将用户的问题和检索到的相关文献传递给生成模型。
- 生成答案：生成模型结合上下文信息，生成关于量子计算的定义和解释。
输出处理：
- 后处理：检查生成文本的语法和准确性，进行必要的格式化。
- 返回结果：将最终的答案返回给用户，例如：“量子计算是一种利用量子力学原理进行计算的技术，其核心概念包括量子叠加和量子纠缠。”