AI 开发入门之 RAG 技术

原创

已于 2025-04-27 21:55:14 修改 · 1.4k 阅读

CC 4.0 BY-SA版权

文章标签：

于 2025-04-24 20:17:39 首次发布

假设你在和一个 AI 聊天助手对话，你问它：

“北京到上海高铁多久？”

这看起来像个非常简单的问题，但它考验的却是 AI 模型的知识广度和知识时效性。

你希望它能回答类似这样：

“大约 4.5 到 6 小时，具体取决于车次。”

但是，假设这个 AI 模型训练得比较早，它可能回答是——

“我不知道。”

或者：

“我认为北京和上海之间目前没有高铁。”（因为它只看到了 2010 年以前的数据）

这就暴露出一个大语言模型的通病：

训练完就定格了，它不会自己更新知识。

所有的大语言模型（如 GPT、Claude、Gemini）在训练时都要读取大量文本，比如：

训练结束后，它就像一个“背书高手”，记住了大量的知识。但这也意味着一但遇到新知识、实时内容、你私有的数据，它就歇菜了。

所以问题就来了：怎么让模型既有“语言能力”，又能随时“看资料再回答”呢？

这时候就该 RAG 登场了！

RAG，全称是 Retrieval-Augmented Generation，翻译为“检索增强生成”。

通过字面意思也能看出来它的核心作用，通过检索来增强生成（废话）

用通俗话来讲：
它让 AI 在回答之前，先“查资料”，再用大模型来“组织语言”。

就像你考试的时候如果不确定答案，那就翻课本，然后用自己的话组织一段回答。

想象一个真实的场景，比如你在一家 SaaS 公司，客户经常问你：

这些内容，可能都写在：

而传统的 ChatGPT 模型对这些你们内部的这些专属知识一无所知。

这时候你就可以用 RAG，它的基本流程是：

这样的系统既懂你公司，又能写好回答。

所以 RAG 的核心优势显而易见：