大模型Agent几种常见的架构设计模式

 ▼最近直播超级多,预约保你有收获

13c5e0dc8c6bc7644c072c1b880f0713.png

架构设计模式已成为程序员的重要技能。在大模型 Agent 智能体应用领域, 同样需要架构设计模式来支撑大模型应用在企业中规模的落地。

根据多年的架构设计经验,我在这里整理总结了一些针对大模型应用的设计方法和架构模式,试图应对和解决大模型应用实现中的一些挑战:推理成本问题、推迟性能延迟问题、生成幻觉问题、生成复读机等问题。

今天先来介绍最常用的 ReAct 架构设计模式

 1

ReAct 架构设计模式

ReAct 是 Reseaning 和 Action 两个词的前缀合成,代表着先推理再行动的一种架构设计模式。进一步拆解来看,ReAct 有3个重要的组成部分:Planning(规划)、Action(行动)、Observation(观测),如下图所示:

de60a0c0a54a0371e69234d5a5ac574e.png

我们先来看一个工作中的案例:马上五一长假了,你老板让你给他安排从上海去巴黎的行程,给你的预算是8K。

你收到这个任务后,

第一步:通过大脑思考给出一个 Planning(规划)的方案,从上海直飞巴黎。

第二步:需要通过去哪儿等订票网站 Action(行动)落实第一步的规划方案。

第三步:对订票 Action(行动)的过程进行观测,发现从上海直飞巴黎的机票最便宜的都需要1W+,老板给的预算不够,因此需要重新规划行程(Replanning),选择转机的方案,如下图 6990 元就够了。

b548833d92d6c15fb4de5b4f56c57cf0.jpeg

目前世界上最聪明的 Agent 就是人类,大模型 Agent 智能体是仿照人类的思维方式来完成各种任务,因此大模型 Agent 智能体同样需要 ReAct 的 Planning-Action-Observation 三步架构落地方式。

 2

ReAct 架构设计模式代码实现

大模型 Agent 智能体的 ReAct 架构设计模式本质是将人类的思维、做事方式以 Prompt Engineering 的方式告诉大模型进行规划、并调用工具完成执行、形成 Run Loop 循环持续迭代直到完成对应的任务。

推荐 Sam Witteveen 开源的 ReAct 的架构设计实现,Github 地址如下:https://github.com/samwit/langchain-tutorials/blob/main/agents/YT_Exploring_ReAct_on_Langchain.ipynb

代码结构主要有以下几步:

第一步:生成提示词。

将代码中预设好 ReAct 的提示词模板(格式:Quesion->Thought->Action->Observation)和用户的问题进行合并。

第二步:调用大模型生成 Thought + Action。

将 Few-shot 少样本提示词发给大模型,大模型生成一堆 Thought、Action 和 Observation,我们并不希望大模型输出 Observation。因此在代码里通过 Stop.Observation 来控制大模型遇到 Observation 后停止输出,最后大模型仅仅返回 Thought 和 Action。

第三步:调用外部工具(API)完成执行。

获得 Action 后,若非 “Finish” 状态,大模型将运用其 Function Calling 能力,即将 Action 中的自然语言转化为对应外部工具可理解的 API 调用。此功能本质上是对大模型进行微调以实现语言到 API 接口格式的精准转换。

第四步:生成 Observation。

API 接口响应数据接收后,系统会将其转化为自然语言表述,形成Observation。接着,将新生成的 Observation 与先前的 Thought 及当前非“Finish”的 Action 一并提交给大模型,继续执行步骤2(Thought 生成)与步骤3(Action 转化及执行)。这一循环将持续进行,直到接收到 Action为 “Finish” 为止。

第五步:完成输出。

在流程结束时,最后一个 Observation 会被转化为易于理解的自然语言表述,然后呈现给用户,作为整个交互过程的最终输出结果。

为了帮助同学们彻底掌握大模型 Agent 智能体、知识库、向量数据库、 RAG、知识图谱的应用开发、部署、生产化,今天我会开两场直播和同学们深度剖析,请同学们点击以下预约按钮免费预约

 3

!送!AI大模型开发直播课程

大模型的技术体系非常复杂,即使有了知识图谱和学习路线后,快速掌握并不容易,我们打造了大模型应用技术的系列直播课程,包括:通用大模型技术架构原理、大模型 Agent 应用开发、企业私有大模型开发、向量数据库、大模型应用治理、大模型应用行业落地案例等6项核心技能,帮助同学们快速掌握 AI 大模型的技能。

 🔥即将开播 

立即扫码,即可免费预约

进入直播,大佬直播在线答疑!

4c31c6c965c534d096584cfcad5bb92a.gif

9e14d1b652b6501eb74080982e1cdf75.png

本期名额有限

高度起始于速度(手慢无!!)

 4

!!再送!!《AI 大模型技术知识图谱

最近很多同学在后台留言:“玄姐,AI 大模型技术的知识图谱有没?”、“AI 大模型技术有学习路线吗?”

我们倾心整理了 AI 大模型技术的知识图谱快来领取吧!

095695e841adc5ec8cd0ce236e1648ae.png

这份业界首创知识图谱和学习路线,今天免费送给大家一份!

只需要以下3步操作就可免费领取:

第一步长按扫码以下我的视频号:玄姐谈AGI

eea2595dda43446a6a7eede3cece39c7.png

第二步:扫码后,点击以下关注按钮,就可关注我。

3946a695d12a10e6e2981aecd0505752.jpeg

第三步:点击"客服“按钮,回复知识图谱即可领取。

144b1451c2a1dd0f4c7919ff2370c2b5.jpeg

 5

精选福利《知识库上下文丢失问题解决》

以下视频你将学到:

    1、知识库为什么会有上下文丢失的问题

    2、知识库上下文丢失如何解决?

END

  • 12
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值