【大模型智能体】UpsonicAI-面向任务可靠执行的智能体框架

本文链接：https://blog.csdn.net/weixin_65514978/article/details/146261242

1. 背景介绍

基于大模型的智能体指的是结合大模型与关键模块（如规划与记忆）来执行复杂任务的应用架构。在构建大模型智能体时，大模型充当主要控制器或“大脑”，管理完成任务或响应用户请求所需的操作流程。大模型智能体通常包含核心模块，如规划、记忆和工具使用。

为什么光靠大模型还不够，还需要引入智能体？关于这个问题，有兴趣可以看下我们之前的文章《Agentic RAG(智能体RAG) 》。即使使用RAG系统提供相关信息，也可能不足以处理这个复杂查询。因为该问题需要大模型将任务拆解为多个子任务，并依靠工具和操作流程来最终得出完整答案。一个可能的解决方案是构建一个大模型智能体，使其能够访问搜索API、相关文献以及公共/私有数据库，以提供相关的信息。此外，大模型还需要访问“代码解释器”工具，以处理相关数据。

开源的智能体框架很多，但是从商用角度来说，会更倾向于稳定、可靠的系统实现，而不只是停留在demo阶段。之所以介绍Upsonic，是因为其在稳定性层面有相对可靠的保证。

Upsonic 是一个专注于可靠性的框架。表格中的结果基于小规模数据集生成，展示了 JSON 键转换的成功率。测试过程中未对框架进行硬编码修改，仅启用了各框架的现有功能并执行测试。测试采用 GPT-4o 进行。每个部分进行了 10 次转换，表格中的数字表示错误次数。例如，如果显示 7，则意味着 10 次转换中有 7 次出错。

2. Upsonic-AI智能体框架

Upsonic 是一个面向数字工作者和垂直 AI 智能体的任务导向型 AI 智能体框架。能够编排大模型调用、智能体和计算机操作完成任务。

组件	描述	关键特性
任务（Tasks）	希望完成的工作	- 有明确的目标
		- 使用特定工具
		- 融入更大的流程
		- 产生可操作的结果
智能体（Agents）	使用工具完成任务的大模型	- 对工具的操作
		- 自我反思
		- 记忆
		- 上下文压缩
安全运行环境（Secure Runtime）	运行代理的隔离环境	- 本地部署
		- 云端
		- 定制化
模型上下文协议（Model Context Protocol）	大模型工具标准	- 广泛的工具支持

关于Model Context Protocol（MCP），可以参考我们在2月12日发的《MCP(Model Context Protocol) 大模型智能体第一个开源标准协议》，时下非常火的概念。智能体这一波火热，manus功不可没，虽然最后被证明是一个拼接怪。但我觉得可能是大家对于agent的期望过高，其中能够很好的整合大模型生态工具和资源，非常丝滑流畅完成指令任务，就是一个非常了不起的创造。

该框架的能力特点，主要有：

1. 任务

    完成需要实现的任务，并以多种方式运行它们以获取结果，专注于任务本身，而非流程。

2. 自动角色配置：

    Upsonic框架自动生成角色并分配相应任务。

3. MCP支持

直接集成由社区和企业开发的全面工具池。通过官方工具实现稳定性保障。

4. 可扩展性

    最关键的核心组件部署在服务端，可通过Docker部署服务器，并以无状态方式在客户端与应用程序进行轻量级集成。

5. 直接调用大模型

    如果任务简单且无需子任务，无需使用智能体流程。可直接调用大模型并即时获取结果。

6. 对象化响应

    与大模型协作时，为获得更精确的结果，响应具备可编程性。