Function Call & ReACT，Agent应用落地的加速器

最新推荐文章于 2025-04-21 13:14:43 发布

神州问学

最新推荐文章于 2025-04-21 13:14:43 发布

阅读量4.6k

点赞数 30

文章标签： react.js 前端人工智能 Agent AIGC

本文链接：https://blog.csdn.net/2401_82452722/article/details/139098181

版权

探索智能体Agent的未来之路：Function Call与ReACT框架的较量，谁能引领未来？

©作者|格林

来源|神州问学

引言

各大平台出现智能体应用创建，智能体逐渐落地，背后的使用哪种框架？

随着各大平台，例如百度千帆APPbuilder、阿里百炼、字节的扣子等等，逐渐落地智能体应用，其背后的技术和框架引起了广泛关注。智能体（Agent），也称为代理，是一种使用大语言模型（LLM）来促进推理过程并根据模型的建议采取行动的实体。尽管大语言模型在自然语言理解和生成方面取得了巨大进步，但仍然也存在一些限制：知识有限并难以实时更新、缺乏审查与安全控制、以及无法直接执行语言之外的任务。光使用模型本身现阶段还难以直接满足实际场景的需求，因此，开发智能体成为了一种应用解决方案。

智能体的基本概念是在没有人工定义工作流（Workflow）的情况下，利用外部工具或功能，选择要执行的一系列操作。对于 toB 产品，智能体能够解决功能点繁多、使用链路冗长、使用方法复杂难上手等问题。从技术角度来看，智能体通过大模型理解用户意图并生成结构化描述，进而执行相关操作。因此，智能体在实际应用中扮演着至关重要的角色，成为了连接大模型和现有应用的桥梁。

市场上现在出现了众多种类的智能体应用，其中大致可以分为两种主要的方式：以ReACT行动链为主的较为复杂的智能体结构，和以Function Calling（函数调用）模型为主的轻量级智能体结构。

一、两种框架原理概述：

“吟游诗人分为两种，一种懂得如何写诗，另一种懂得根据意境引用别人写的诗”

1.1. ReACT 大致原理与历史

在大模型的涌现能力刚被人们发掘的时候，人们意识到生成式AI的潜力可能不止局限于文本内容的生成，如果让大模型能够和外部世界交互，是不是就能获得更广泛的信息，甚至对外部环境造成一定影响？基于这个出发点，研究者把推理（例如思维链提示）和行动（例如 WebGPT、SayCan、ACT-1）进行结合，并提出了ReACT框架，其核心思想是将推理和行动结合起来，形成一个智能、自主的智能体结构，并拥有与外部环境交互的能力。

ReACT框架的一个关键特点是其任务拆解模块，能够将复杂的任务拆解成一系列更小、更明确的子任务，这些子任务更容易被模型理解和执行，让模型不再“消化不良”。例如，ReACT可以帮助模型决定进行API调用、执行查询等操作，天气预报、计算器是大家耳熟能详的例子。这样，模型就可以在与外部源交互的过程中收集更多的信息，以更好地完成复杂的任务。

ReACT技术的一个关键挑战是如何在API调用中处理函数参数。为了解决这个问题，通常需要要求模型返回特定格式的响应，以便区分不同的阶段（思考、行动、观察）。

ReAct框架的应用已经在多种语言和决策任务中得到了验证，其有效性在问答、事实验证等任务中得到了展示。在早期的智能体应用尝试中，LangChain就提供了以ReACT为框架的智能体应用开发方式。基于ReAct通过与简单的维基百科API交互，生成类似人类的任务解决轨迹，比没有推理痕迹的基线更容易解释。这种