Function Call & ReACT,Agent应用落地的加速器

图片

探索智能体Agent的未来之路:Function Call与ReACT框架的较量,谁能引领未来?

©作者|格林

来源|神州问学

引言

各大平台出现智能体应用创建,智能体逐渐落地,背后的使用哪种框架?

随着各大平台,例如百度千帆APPbuilder、阿里百炼、字节的扣子等等,逐渐落地智能体应用,其背后的技术和框架引起了广泛关注。智能体(Agent),也称为代理 ,是一种使用大语言模型(LLM)来促进推理过程并根据模型的建议采取行动的实体。尽管大语言模型在自然语言理解和生成方面取得了巨大进步,但仍然也存在一些限制:知识有限并难以实时更新、缺乏审查与安全控制、以及无法直接执行语言之外的任务。光使用模型本身现阶段还难以直接满足实际场景的需求,因此,开发智能体成为了一种应用解决方案。

智能体的基本概念是在没有人工定义工作流(Workflow)的情况下,利用外部工具或功能,选择要执行的一系列操作。对于 toB 产品,智能体能够解决功能点繁多、使用链路冗长、使用方法复杂难上手等问题。从技术角度来看,智能体通过大模型理解用户意图并生成结构化描述,进而执行相关操作。因此,智能体在实际应用中扮演着至关重要的角色,成为了连接大模型和现有应用的桥梁。

市场上现在出现了众多种类的智能体应用,其中大致可以分为两种主要的方式:以ReACT行动链为主的较为复杂的智能体结构,和以Function Calling(函数调用)模型为主的轻量级智能体结构。

一、 两种框架原理概述:

“吟游诗人分为两种,一种懂得如何写诗,另一种懂得根据意境引用别人写的诗”

1.1.  ReACT 大致原理与历史

在大模型的涌现能力刚被人们发掘的时候,人们意识到生成式AI的潜力可能不止局限于文本内容的生成,如果让大模型能够和外部世界交互,是不是就能获得更广泛的信息,甚至对外部环境造成一定影响?基于这个出发点,研究者把推理(例如思维链提示)和行动(例如 WebGPT、SayCan、ACT-1)进行结合,并提出了ReACT框架,其核心思想是将推理和行动结合起来,形成一个智能、自主的智能体结构,并拥有与外部环境交互的能力。

ReACT框架的一个关键特点是其任务拆解模块,能够将复杂的任务拆解成一系列更小、更明确的子任务,这些子任务更容易被模型理解和执行,让模型不再“消化不良”。例如,ReACT可以帮助模型决定进行API调用、执行查询等操作,天气预报、计算器是大家耳熟能详的例子。这样,模型就可以在与外部源交互的过程中收集更多的信息,以更好地完成复杂的任务。

图片

ReACT技术的一个关键挑战是如何在API调用中处理函数参数。为了解决这个问题,通常需要要求模型返回特定格式的响应,以便区分不同的阶段(思考、行动、观察)。

图片

ReAct框架的应用已经在多种语言和决策任务中得到了验证,其有效性在问答、事实验证等任务中得到了展示。在早期的智能体应用尝试中,LangChain就提供了以ReACT为框架的智能体应用开发方式。基于ReAct通过与简单的维基百科API交互,生成类似人类的任务解决轨迹,比没有推理痕迹的基线更容易解释。这种

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值