揭秘 RAG：为什么说它是让大语言模型（LLM）更聪明的秘密武器？

最新推荐文章于 2025-05-03 09:07:35 发布

大模型老炮

最新推荐文章于 2025-05-03 09:07:35 发布

阅读量746

点赞数 24

文章标签：语言模型人工智能 RAG LLM 大模型 AI大模型大模型入门

本文链接：https://blog.csdn.net/2401_85375151/article/details/147580036

版权

现在人工智能（AI）很火，尤其是像 ChatGPT 这样的大语言模型（LLM），它们能聊天、写文章、写代码，感觉无所不能。但有时候，它们也会犯一些小错误，比如信息过时了，或者一本正经地胡说八道（这叫“幻觉”），或者你问它一些你们公司内部的事情，它就完全不知道了。

为了解决这些问题，科学家们想出了一个聪明的办法，叫做RAG。

想象一下，现在的大语言模型就像一个超级聪明的学生，读了很多很多的书（训练数据），知识储备非常丰富。但是：

知识有“保质期”：它学习的知识是截止到某个时间点的。比如，你问它昨天发生的新闻，或者最新的科技进展，它可能就不知道了，因为它“毕业”之后就没再学新东西。
可能会“瞎编”：有时候遇到它不太确定的问题，为了不冷场，它可能会根据自己学过的知识，“推测”或“编造”一个看起来很像真的答案。这就是所谓的“幻觉”。
不知道“内部信息”：你公司的内部规章制度、项目资料、最新的销售数据等等，这些没有公开在网上的信息，它肯定不知道。

RAG 技术就是为了解决这些痛点而生的。

RAG 的英文全称是 Retrieval-Augmented Generation，中文可以叫做 “检索增强生成”。

咱们把它拆开看：

Retrieval (检索)：就像我们遇到不知道的问题，会去搜索引擎（比如百度、谷歌）或者翻书查找资料一样，这一步就是让 AI 去一个外部的知识库里把相关的、最新的信息找出来。
Augmented (增强)：就是把找到的这些信息，补充给那个聪明的 AI。
Generation (生成)：最后，AI 结合它自己本来就知道的知识和刚刚从外部找到的新信息，生成一个更靠谱、更准确、更新的答案给你。

简单打个比方：

没有 RAG 的 AI，就像一个只靠记忆答题的学生，虽然博学，但信息可能过时，也可能记错。

有了 RAG 的 AI，就像一个开卷考试的学生！在回答问题前，它被允许先去查阅指定的最新资料（检索），然后结合自己学过的知识和查到的资料，写出答案（增强生成）。这样一来，答案自然就更准确、更与时俱进了。

RAG 的工作流程其实挺符合咱们解决问题的直觉，主要分三步：

当你向 RAG 系统提问时（比如输入：“我们公司最新的报销政策是什么？”），系统首先会分析你的问题，理解你到底想知道什么。有时候它还会稍微改写一下你的问题，让后面的搜索更有效率。

这是 RAG 的核心之一。系统会拿着你的问题（或者处理过的问题），去一个指定的知识库里搜索相关信息。

知识库是啥？ 这个知识库可不是 AI 原来训练时的那个“大脑”，而是外部挂载的。它可以是：
- 互联网上的海量网页（像搜索引擎一样）
- 一个公司内部的文件集合（比如 Word 文档、PDF、数据库）
- 某个特定领域的专业文献库（比如医学、法律）
怎么找？ 它不是简单地做关键词匹配。通常，系统会把你的问题和知识库里的文档都转换成一种叫做“向量”（Vector Embeddings）的数学表示。这种表示能捕捉语义信息（意思）。然后，系统会计算你的问题向量和知识库里每个文档（或文档片段）向量的相似度，找出那些在意思上最接近你问题的文档片段。就好比，它要找的不是字面完全一样的内容，而是谈论同一个话题的内容。
找到啥？ 它会挑出几个最相关的文档片段（Chunks），作为回答问题的“参考资料”。

这是 RAG 的另一半核心。现在，系统把两样东西一起交给那个聪明的大语言模型（LLM）：

然后，系统会给 LLM 一个指令，大概意思是：“嘿，根据你自己的知识，并重点参考我给你的这些资料，回答用户的问题。”

LLM 就像拿到“开卷考试”的“小抄”一样，它会阅读这些新鲜、具体的资料，然后结合自己强大的语言理解和生成能力，生成一个既流畅自然，又信息准确、基于事实的答案。

这个最终答案，就因为它结合了外部检索到的最新或特定信息，所以比单纯靠 LLM “回忆”出来的答案要靠谱得多。

当然，RAG 也不是完美的：

假设你问一个聊天机器人：“给我总结一下咱们项目组上周的会议纪要。”

没有 RAG 的机器人：很可能会说：“对不起，我没有访问你们项目组会议纪要的权限。” 或者根据网上找到的通用会议纪要模板瞎编一个。
有 RAG 的机器人（接入了公司内部文档系统）：
1. 它会去公司的文档系统里检索“项目组上周会议纪要”。
2. 找到相关的会议纪要文档。
3. 把找到的纪要内容喂给 LLM。
4. LLM阅读纪要，并生成一个简洁的总结给你。