傻傻分不清?一文彻底说清Agentic RAG的前世今生!

生成式AI的发展日新月异,一不小心你就会淹没在新的概念中。RAG(检索增强生成)、Agent(智能体)作为主流的大语言模型(LLM)应用形式已经广为人知。这不还经常听到一个词:Agentic RAG,前两天还有人问小编它到底是RAG还是Agent?今天我们就来彻底说清楚Agentic RAG。

前排提示,文末有大模型AGI-CSDN独家资料包哦!

01

为什么需要Agentic RAG?

首先,RAG是什么?RAG是用检索到的外部知识来对LLM进行能力增强的一种技术,旨在降低LLM的幻觉并让其更好的适应特定领域内的应用场景。通俗的讲:RAG就是给LLM增加一个可快速查询的“外挂”知识库,增强其能力,以防它不懂的时候胡说八道

RAG = LLM + 知识库 + 检索器

它可以让AI准确的回答诸如这样的问题:

  • 公司的财务报销审核流程是怎样的?

  • 上半年销售业绩前三名代理商是谁?

  • 总结公司最新财报中的关键要点?

经典的RAG流程是借助检索器从知识库中查询问题相关(语义接近)的内容,并把这些内容作为LLM回答的上下文,从而得出最终答案。

现在,让我们考虑以下几个查询场景:

  • 需要能够使用不同的检索技术来应对不同类型的查询问题。 如既能回答事实性查询(”xPhone手机详细参数“),也能回答总结性的问题(”总结下这篇论文要点“)

  • 需要融合多个数据源的检索结果给出响应。 比如这样的查询:

    ”查询销量最高的三个代理商的摘要信息及其关联公司“

    这里的问题是:

  • 查询销量最高的代理商需要查询CRM系统的数据库

  • 代理商的详细信息存储在非结构化文档中

  • 关联公司的查询需要查询某个知识图谱数据库

单一的RAG检索与生成管道显然无法应对这样的问题。

  • 需要结合外部工具来增强RAG管道的回答能力与响应质量。 比如这样一个查询任务:

    “对比竞品公司产品与我公司产品,并总结媒体评论”

    为了完成这个问题,你需要:

  • 借助本地检索器,查询自身产品信息

  • 借助Web搜索查询竞品信息

  • 借助公开的API查询某些自媒体评论

这样的一个融合性查询任务也是单一RAG管道无法完成的。

  • 希望RAG在检索相关数据后能够自我反思评估,必要时重新检索甚至改写问题。

这些都是在实际应用中可能会面临的需求,经典的RAG方案在面临这些场景时会捉襟见肘,因此更“Agentic”的RAG出现了。

02

什么是Agentic RAG?

Agentic RAG就是一种融合了Agent能力的RAG,而Agent的核心能力是自主推理与行动。所以Agentic RAG就是将AI智能体的自主规划(如路由、行动步骤、反思等)能力带入到传统的RAG,以适应更加复杂的RAG查询任务。

Agentic RAG如何应对这些典型的复杂任务?一起来看。

  • 在不同类型的RAG管道间自主选择(路由),以适应任务的多样性:

  • 融合多种类型的RAG管道与数据源,以适应综合性复杂查询任务:

  • 与必要的外部工具协作,以增强输出的准确性:

整体来说,Agentic RAG的“智能体”特征主要体现在检索阶段,相对于传统RAG的检索,Agentic RAG更能够:

  • 决定是否需要检索

  • 自主决策使用哪个检索引擎

  • 自主规划使用检索引擎的步骤

  • 评估检索到的上下文,并决定是否重新检索

  • 自行规划是否需要借助外部工具

03

Agentic RAG VS 传统RAG

Agentic RAG在整体流程上与传统RAG一脉相承:检索-合成上下文-生成,但由于融入了Agent的自主能力,从而具有更强的适应性与任务质量。

这里的传统RAG指遵循“检索-上下文-生成”单一顺序流程的RAG应用。随着开发框架的不断完善,当前一些常用的高级RAG模块已经具备了部分Agentic的特征,比如:语义路由、多步骤查询转换、子问题查询转换等。


传统单一流程RAGAgentic RAG
场景数据环境简单、任务单一
企业级数据环境,任务多样
数据源
通常基于单个检索引擎通常基于多个检索引擎
索引向量索引为主可灵活结合多种索引
检索规划
无规划或静态规则动态规划下一步检索策略
多步检索
通常不支持
借助多步骤推理自主实现
外部工具通常不支持自动推理使用必要的工具
反省机制通常不支持
借助反省优化问题或重新检索
灵活性
不够灵活,流程固定
自主推理,或灵活编排

04

Agentic RAG技术架构

与顺序式的传统RAG架构相比,Agentic RAG的核心是Agent,而RAG管道(通常是检索器,也可能是完整的RAG查询引擎)则可以看作是Agent使用的一种工具,从而完美的融合到Agent的架构中。

从这个角度说,Agentic RAG是RAG,但更是Agent。 从技术架构看,也存在单Agent架构与多Agent架构。

【单Agent的Agentic RAG】

在这个架构中,只有一个具有自主能力的Agent。RAG管道与外部工具都作为Tool提供给Agent,Agent根据输入问题规划与决策这些工具的使用,检索与累积更全面的上下文,最后输出全面而准确的结果。

如果这里的Agent每次规划只会选择一个后端RAG检索管道,那么也就退化成了一个语义路由器模块。

【多Agent的Agentic RAG】

这是一个多层的Agent架构:一个顶层的Agent负责协调多个二级Agent,每个二级Agent再负责特定领域或特定类型的检索或查询任务,可以根据需要灵活划分不同Agent的职责。

比如,你可以这样设计:

  • Agent1负责企业内部知识库的检索。协调使用多个不同索引类型的检索器,如向量、知识图谱、甚至SQL检索。

  • Agent2负责客户相关数据的检索任务。协调使用多个不同地区客户数据的检索器。

  • Agent3负责借助各种工具从互联网检索必要的外部信息。

  • 顶层的Agent则负责管理与协调使用上面三个Agent来共同完成复杂查询任务,实现任务拆分、派发与搜集结果,并最终响应用户。

多Agent的Agentic RAG架构具备更大的灵活性,实际开发中,你可以对不同的Agent进行单独规划、实现与调试,最后组合成一个更完备的RAG系统,提供超越传统的查询能力。

05

总结

Agentic RAG通过将智能体的核心能力引入到传统RAG,借助Agent的规划与推理能力,极大的增强了RAG检索的全面性、灵活性与准确性,使得能够执行更复杂与多样的数据密集型的查询任务,激发了RAG应用的新潜力。

当然,进步也伴随着挑战。利用智能体思想完成复杂任务也带来了对LLM的更深层依赖,引发了新的响应延迟与不确定性的问题。因此,在开发和使用 Agentic RAG 系统时,需要审慎考虑其优劣,以实现更高效和可靠的应用。

读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

👉AI大模型学习路线汇总👈

大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

在这里插入图片描述

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
在这里插入图片描述
在这里插入图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

Agentic RAG 是一种先进的信息检索和生成框架,它结合了代理(Agent)、检索增强生成(Retrieval-Augmented Generation, RAG)以及大型语言模型(LLM)的能力。这种架构旨在更有效地处理复杂的查询请求,并提供更加准确的答案。 核心特点包括: - 动态编排机制:利用AI代理的灵活性来适应不同类型的用户需求,调整检索与生成策略以解决复杂的问题。 - 查询优化:当初始检索结果不理想时,系统会尝试改进查询条件或者采用其他手段提高结果质量。 - 工具调用:可以集成外部工具和服务,例如特定领域的API或数据库访问权限,从而扩展系统的功能范围。 - 多步推理能力:支持需要连续逻辑步骤才能完成的任务解答过程。 - 应用于各个领域:可以根据具体的应用场景创建专业的文档代理(Doc Agent),如财务、法律等领域,帮助收集相关信息并形成综合性的报告文本。 为了使 Agentic RAG 更加实用,在实际应用中通常还会涉及到以下几个方面的工作: 1. 定义明确的目标群体及其常见问题类型; 2. 设计合理的数据源接入方案确保获取高质量的信息资源; 3. 开发高效的算法实现快速而精确的结果匹配; 4. 测试和完善整个流程保证稳定可靠的用户体验。 通过这种方式,Agentic RAG 能够显著提升自动化问答服务的质量,特别是在面对那些涉及广泛背景知识和技术细节的情况下表现尤为突出。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

程序员二飞

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值