RAG原理简介

最新推荐文章于 2025-04-18 16:14:21 发布

wn1652400018

最新推荐文章于 2025-04-18 16:14:21 发布

阅读量1.7k

点赞数 26

文章标签：自然语言处理笔记

本文链接：https://blog.csdn.net/wn1652400018/article/details/139474377

版权

RAG 技术概述

定义
RAG(Retrieval Augmented Generation)是一种结合了检索(Retrieval)和生成(Generation)的技术,旨在通过利用外部知识库来增强大型语言模型(LLMs)的性能。它通过检索与用户输入相关的信息片段，并结合这些信息来生成更准确、更丰富的回答。

解决LLMs在处理知识密集型任务时可能遇到的挑战，如，生成幻觉(hallucination)、过时知识、缺乏透明及可追溯的推理过程。提供更准确的回答、降低成本、实现外部记忆。

应用场景
问答系统、文本生成、信息检索、图片描述

RAG工作原理
在这里插入图片描述索引（index）、检索（retrieval）、生成（generation）是经典RAG的三个组成部分。索引负责将知识源(如文档或网页)分割成chunk，编码成向量，并存储在向量数据库中；检索负责在接收到用户的问题后，将问题也编码成向量，并在向量数据库中找到与之最相关的文档块(top-k chunks )；生成部分负责将检索到的文档块与原始问题一起作为提示(prompt)输入到LLM中，生成最终的回答。

向量数据库（Vector-DB）也是RAG的一个重要的概念。在索引阶段它被用来存储数据，将文本及其他数据通过其他预训练的模型转换为固定长度的向量表示，这些向量能够捕捉文本的语义信息；在检索阶段，根据用户的查询向量，使用向量数据库快速找出最相关的向量的过程通常通过计算余弦相似度或其他相似性度量来完成，检索结果根据相似度得分进行排序最相关的文档将被用于后续的文本生成。

在这里插入图片描述示例中用户询问一件三天前发生的事情，模型没有在该数据上训练过。怎么看待Sam Altman 被解雇又火速回归的事情。在没有RAG的情况下模型说不知道该事情。在RAG的加持下，检索模块检索到了关于该事件的信息，将该信息和用户的体温一并送给大模型后，大模型可以准确回答该问题。

RAG的发展进程
RAG的概念最早是由Meta(Facebook)的Lewis等人在2020《Retrieval-Augmented Generation forKnowledge-Intensive NLp Tasks》中提出的。
在这里插入图片描述 Naive RAG：就是前文中介绍的朴素的RAG，一般被用在问答系统、信息检索相关应用。
Advanced RAG：在三个基础模块之外，在检索前后都进行了增强。在检索之前对用户的提问进行了路由、扩展、重写的处理，对于检索到的信息进行重排序、总结、融合等处理，使得对信息收集和处理的效率更高。是的RAG可以在摘要生成、内容推荐的场景下应用。
Modular RAG：将RAG的基础部分和后续优化技术和功能模块化，可以根据实际业务定制，完成如多模态任务、对话系统等更高级的应用。