Agentic RAG：超越传统RAG与案例分享

程序员笑武

于 2024-12-02 19:55:21 发布

阅读量2k

点赞数 28

文章标签：前端网络服务器分类数据挖掘人工智能深度学习

本文链接：https://blog.csdn.net/m0_59164304/article/details/144197090

版权

在人工智能快速发展的今天，检索增强生成（Retrieval-Augmented Generation，简称 RAG）技术已经成为大语言模型（LLM）应用的关键突破。RAG 框架不断推陈出新、日新月异，从 Navie RAG、高级 RAG、模块化 RAG，发展到现在的 Graph based RAG，甚至混合高级 RAG 与 GraphRAG 的 HybridRAG。那么，如何在日新月异的 RAG 技术下，开发一种能够不断适应的框架呢？今天，我们将深入探讨 Agentic RAG，这一革命性的方法正在重新定义智能信息检索与生成的边界。

本文先讨论 Agentic RAG 常见范式，然后推荐一些流行的 Agentic RAG 开发示例：Nvidia 的 Agentic RAG 案例和基于 LlamaIndex 的 Agentic RAG 设计等。

1. Agentic RAG：智能决策的新范式

传统 RAG 系统的工作方式相对简单：接收用户查询 → 检索相关文档 → 基于文档生成答案。但在实际应用中，这种线性模式通常显得过于刻板和局限。现实世界的问题往往错综复杂，需要更加智能和灵活的方案。

Agentic RAG 引入了一个关键概念：让 Agent 在整个信息检索和生成过程中主动思考和决策。这不仅仅是一个技术术语，而是一种全新的智能工作范式。

1. 查询分析：智能重构

在 Agentic RAG 中，原始用户查询不再被直接照搬，而是经过精细的分析和重构：

查询重写：将模糊或复杂的查询转化为更加精确、可检索的形式
智能路由：判断是否需要额外的数据源来全面回答问题

想象一下，用户询问"最近的天气对公司销售有什么影响"。传统 RAG 可能会束手无策，而 Agentic RAG 会：

识别需要整合销售数据和天气信息
智能地从不同数据源检索相关信息
综合分析并生成有洞察力的答案

2. 多源数据检索：打破信息孤岛

Agentic RAG 的一大优势在于其灵活的数据检索能力：

实时用户数据：根据用户当前上下文动态调整
内部文档：精准匹配组织内部知识
外部数据源：从互联网实时获取最新信息

举个例子，对于一个客户支持场景，系统可以：

查看用户历史工单
检索产品使用手册
获取最新的技术更新信息
综合生成最精准的解决方案

3. 动态答案生成与优化

Agentic RAG 不满足于仅仅给出一个答案，而是通过多轮迭代不断优化：

生成多个候选答案
评估每个答案的准确性和相关性
必要时重新查询或调整生成策略

4. 从失败中学习：自我修正机制

传统系统遇到无法回答的问题往往会直接告诉用户"无法解决"。而 Agentic RAG 则会：

识别信息鸿沟
主动寻找补充信息源
尝试重新生成更优答案

2. Agentic RAG 资源推荐

1. Nvidia Agentic RAG

Nvidia 展示的 Agentic RAG 只是一个示例，参考了如下 3 篇论文实现。

路由 (Adaptive-RAG[1]). 根据问题路由到不同的检索器
回退 (Corrective RAG[2]). 如果文档与查询不相关，则回退到网络搜索
自纠错 (Self-RAG[3]). 当答案具有幻觉或者未能回答问题时候，自动尝试修正答案。

它基本实现了如下图所示的框架，它使用打分机制评判答案是否包含幻觉，是否需要加入新的信息。具体地址可以参考：https://github.com/NVIDIA/workbench-example-agentic-rag/blob/main/code/langgraph_rag_agent_llama3_nvidia_nim.ipynb，整个代码基于Langchain开发，使用流程编排完成，包含大量的Prompt设计。

这个项目还包含ChatUI，可以显示具体的运行流程，如下图所示。

在这里插入图片描述

2. LlamaIndex Agentic RAG

DeepLearning.ai 的课程Agentic RAG[4]，由 LlamaIndex 的创始人 Jerry Liu 讲授，描述了一种使用 LlamaIndex 如何构建 Agentic RAG 的流程。它将文档包含检索等流程包装成为一个 Tool，然后包装到 Agent 中，供路由选择调用。而在路由前，它会尝试分解或重写用户查询，然后交给 Router，大概设计流程如下。

agentic-rag-llama

比如你可能会问：“比较一下 adapt rag 和 self-rag，首先分析各个论文中的方法”，查询重写模块可能会将用户提问分解为：

adapt rag 中的方法
self rag 中的方法
对比 self rag 和 adapt rag

然后 Router 会分别调用 self rag 的 summary tool 和 adapt rag 的 summary tool，然后由 LLM 进行总结输出。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述