大模型学习:从单 Agent 到多 Agent 智能助手案例架构演进

关于 Agent 的定义目前还没有形成共识,目前有3个代表性的定义

流行最广的是前 OpenAI 研究与安全副总裁 Lilian Weng 对 Agent 的定义:Agent = LLM + Planning + Tools + Memory

在这里插入图片描述

除此之外,LangChain 对 Agent 的定义为:使用 LLM 决定应用程序控制流的系统

在这里插入图片描述

OpenAI 对 Agent 的定义是:Agent 是能够代表用户自主完成任务的系统

img

尽管目前对 Agent 的定义还没形成共识,但是大家对 Agentic System(智能系统)基本的共识是:Agentic System 是一种有目标、基于环境的决策系统。与 LLM 最大的区别在于,Agentic System 可以与现实世界交互,从感知环境开始,做出决策并执行,影响环境,然后基于反馈调整,不断持续迭代循环。

img

一、Agentic System 架构设计剖析

一个完整的 Agentic System 架构包含四个核心组成部分:

img

  • 感知:为大模型构建上下文信息。常见的方法包括检索增强生成(RAG),查询结构化数据(比如:数据库、网页内容)或者检索历史记录(比如:长短期记忆)。

  • 决策:本质上是 Planning 规划过程。可以通过规则引擎(Workflow)实现,也可以由大语言模型(LLM)驱动(自主 Agent),或者借助外部规划器。在设计时需要权衡泛化能力和准确性–LLM 驱动的决策泛化能力强,但不确定性较高;而基于规则的工作流泛化能力较弱,但更可控。

  • 执行:通过调用工具来改变环境。包括 API 调用(比如:REST、RPC、SQL、函数调用)或与图形软件的集成(比如:Anthropic 的 Computer use)。

  • 反馈:用于评估和迭代的机制。反馈可以通过人工标注、规则或模型生成,更新可以是离线的或在线的。

这个闭环构成了 Agent 的基础单元(building block)。复杂的 Agent 可以由多个小 Agent 组成,复杂业务逻辑大决策通常由一系列小型决策构成。

二、多 Agentic System 架构设计原则

当多个 Agent 协同工作时,就构成了 Multi-Agent 系统。在设计 Multi-Agent 系统时,要避免过度拆分。每个 Agent 应该代表一个明确的业务决策点,并可以通过持续反馈进行优化。只有在单个 Agent 无法满足需求时,才考虑引入更多的 Agent。

第一、借鉴分布式系统的思路,可以把 Agent 比作一台计算机:

  • LLM(大语言模型) 是计算机的 CPU,负责处理和运算。
  • Context window(上下文窗口) 是计算机的 内存,用于临时存储信息。
  • 向量数据库 是计算机的 硬盘,用于长期存储数据。
  • 工具(Tools) 是计算机上的 程序,用于执行特定任务。

分布式系统主要解决以下三个问题:

  1. 性能不足:单台计算机的计算或存储能力有限。
  2. 容错性:单个系统容易出现故障,需要多个系统协同工作以提高可靠性。
  3. 协作:不同团队负责不同的微服务,需要协同工作。

Multi-Agent 系统的设计原则与此类似:

img

  • 解决单次 LLM 调用智力不足的问题:当单个 Agent 无法处理复杂的任务时,可以引入多个 Agent 协同工作。
  • 提高容错性:多个 Agent 协同工作可以提高系统的可靠性和稳定性。
  • 促进协作:不同 Agent 可以负责不同的任务或决策点,实现更复杂的业务逻辑。

第二、Agentic System 架构演进

Multi-Agent 系统的设计应从单个 Agent 开始,只有在单个 Agent 无法满足需求时,才逐步过渡到多 Agent 架构。这种逐步扩展的方式有助于保持系统的简洁性和可维护性。

三、从单 Agent 到多 Agent 智能助手案例架构演进

智能助手的演进遵循了从单 Agent 到 Multi-Agent 的路径:

  • 初始阶段:仅有产品问答模块,使用简单的 RAG(检索增强生成)技术。

  • 技能扩展:添加多种技能,但用户需要手动切换。

  • 意图识别:开发意图识别 Agent,但仍为单 Agent 架构。

  • 多 Agent 体系:随着场景复杂化和多团队协作需求的增加,逐步过渡到多 Agent 体系。

    img

除架构演进外,我们还进行了多项技术优化:

  • RAG 优化:增加查询改写功能,提高系统的鲁棒性。用户不一定会提出完美的问题,通过查询扩展和改写,系统能够更好地处理各种输入变化。

  • 知识图谱:引入 GraphRAG 技术,将产品知识问答的准确度从 76% 提升到 93%。对于算法实力一般但工程能力强的团队,知识图谱是模型后训练的实用替代方案。

  • 强化学习:在经营分析场景中,将评价体系(如 AARRR 模型)转化为强化学习的奖励函数,实现模型的持续优化。

    img

当然,我们也在经营分析场景中基于 SFT(监督微调)和强化学习进行微调。我们之前基于经营分析 Agent 构建的数据集和评价体系,天然地过渡到了 RL(强化学习)领域的环境和奖励函数的构建。我们之前评价一个经营建议好坏的一个重要指标是思考过程是否符合 AARRR 模型,现在在 RL 中,这个指标也成为了奖励函数之一。

普通人如何抓住AI大模型的风口?

领取方式在文末

为什么要学习大模型?

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。

目前,开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景,其中,应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。
在这里插入图片描述

随着AI大模型技术的迅速发展,相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业:

在这里插入图片描述

人工智能大潮已来,不加入就可能被淘汰。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!

最后

如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!

大模型全套学习资料领取

这里我整理了一份AI大模型入门到进阶全套学习包,包含学习路线+实战案例+视频+书籍PDF+面试题+DeepSeek部署包和技巧,需要的小伙伴文在下方免费领取哦,真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

在这里插入图片描述

部分资料展示

一、 AI大模型学习路线图

整个学习分为7个阶段
在这里插入图片描述
在这里插入图片描述

二、AI大模型实战案例

涵盖AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,皆可用。
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

三、视频和书籍PDF合集

从入门到进阶这里都有,跟着老师学习事半功倍。
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

四、LLM面试题

在这里插入图片描述
在这里插入图片描述

五、AI产品经理面试题

在这里插入图片描述

六、deepseek部署包+技巧大全

在这里插入图片描述

😝朋友们如果有需要的话,可以V扫描下方二维码联系领取~
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值