人工智能中的RAG指的是什么

最新推荐文章于 2025-03-07 15:03:24 发布

张3蜂

最新推荐文章于 2025-03-07 15:03:24 发布

阅读量778

点赞数 3

文章标签：人工智能

本文链接：https://blog.csdn.net/AngelCryToo/article/details/142034784

版权

在人工智能领域，RAG（Retrieval-Augmented Generation，检索增强生成）是一种结合检索和生成技术的模型架构。它将外部知识库中的信息检索与大规模语言模型（如GPT）进行结合，从而生成更加准确、相关性更高的回答或文本。

RAG主要应用于需要访问大量外部知识的任务，特别是在回答问题、知识生成或文档分析中。与单纯依赖语言模型的生成方法不同，RAG通过引入检索机制，大幅提升了生成内容的准确性和信息性。

RAG通常分为两个主要步骤：

信息检索（Retrieval）：
这一阶段，RAG会基于输入的提示（如问题或任务描述）去检索外部知识库。知识库可以是维基百科等文档库，也可以是自定义的企业数据库、领域专用文档库等。检索机制可以是基于稀疏向量（如TF-IDF）或基于密集向量（如BERT embedding）的检索。
生成阶段（Generation）：
检索到的信息会作为上下文提供给生成模型（如GPT）。然后，生成模型根据检索到的信息和原始输入生成最终的输出。这种生成方式使得模型能够基于外部信息更准确地生成文本，而不仅仅依赖其训练数据。