【大模型智能体】UpsonicAI-面向任务可靠执行的智能体框架

1. 背景介绍

        基于大模型的智能体指的是结合大模型与关键模块(如规划与记忆)来执行复杂任务的应用架构。在构建大模型智能体时,大模型充当主要控制器或“大脑”,管理完成任务或响应用户请求所需的操作流程。大模型智能体通常包含核心模块,如规划、记忆和工具使用。

        为什么光靠大模型还不够,还需要引入智能体? 关于这个问题,有兴趣可以看下我们之前的文章《Agentic RAG(智能体RAG) 》。即使使用RAG系统提供相关信息,也可能不足以处理这个复杂查询。因为该问题需要大模型将任务拆解为多个子任务,并依靠工具和操作流程来最终得出完整答案。一个可能的解决方案是构建一个大模型智能体,使其能够访问搜索API、相关文献以及公共/私有数据库,以提供相关的信息。此外,大模型还需要访问“代码解释器”工具,以处理相关数据。

        开源的智能体框架很多,但是从商用角度来说,会更倾向于稳定、可靠的系统实现,而不只是停留在demo阶段。之所以介绍Upsonic,是因为其在稳定性层面有相对可靠的保证。

            Upsonic 是一个专注于可靠性的框架。表格中的结果基于小规模数据集生成,展示了 JSON 键转换的成功率。测试过程中未对框架进行硬编码修改,仅启用了各框架的现有功能并执行测试。测试采用 GPT-4o 进行。每个部分进行了 10 次转换,表格中的数字表示错误次数。例如,如果显示 7,则意味着 10 次转换中有 7 次出错。

    2. Upsonic-AI智能体框架

            Upsonic 是一个面向数字工作者和垂直 AI 智能体的任务导向型 AI 智能体框架。能够编排大模型调用、智能体和计算机操作完成任务。

    组件描述关键特性
    任务(Tasks)希望完成的工作- 有明确的目标
    - 使用特定工具
    - 融入更大的流程
    - 产生可操作的结果
    智能体(Agents)使用工具完成任务的大模型- 对工具的操作
    - 自我反思
    - 记忆
    - 上下文压缩
    安全运行环境(Secure Runtime)运行代理的隔离环境- 本地部署
    - 云端
    - 定制化
    模型上下文协议(Model Context Protocol)大模型工具标准- 广泛的工具支持

            关于Model Context Protocol(MCP),可以参考我们在2月12日发的《MCP(Model Context Protocol) 大模型智能体第一个开源标准协议》,时下非常火的概念。智能体这一波火热,manus功不可没,虽然最后被证明是一个拼接怪。但我觉得可能是大家对于agent的期望过高,其中能够很好的整合大模型生态工具和资源,非常丝滑流畅完成指令任务,就是一个非常了不起的创造。

            该框架的能力特点,主要有:

    1. 任务

        完成需要实现的任务,并以多种方式运行它们以获取结果,专注于任务本身,而非流程。

    2. 自动角色配置:

        Upsonic框架自动生成角色并分配相应任务。

    3. MCP支持

        直接集成由社区和企业开发的全面工具池。通过官方工具实现稳定性保障。

    4. 可扩展性

        最关键的核心组件部署在服务端,可通过Docker部署服务器,并以无状态方式在客户端与应用程序进行轻量级集成。

    5. 直接调用大模型

        如果任务简单且无需子任务,无需使用智能体流程。可直接调用大模型并即时获取结果。

    6. 对象化响应

        与大模型协作时,为获得更精确的结果,响应具备可编程性。

    3. 可靠性层

            Upsonic相对其他的智能体框架,比较有特色的,可能就是Reliability Layer。可靠性是AI智能体最关键的概念。使用AI智能体来持续执行自身工作中一些小型、重复性的任务。在这种应用场景下,如果AI智能体无法正确完成任务并提供高质量的结果,就无法将其融入自己的工作流程。

            Upsonic 在这一点上提供了一个增强智能体可靠性的分层系统。该系统按照特定级别进行强化和细化,使用户能够根据自身使用场景创建可靠的AI智能体。

            大模型输出的可靠性至关重要,特别是在数值运算和执行操作方面。Upsonic 是通过采用多层次的可靠性体系来解决,采用控制智能体和验证轮次以确保输出的准确性。

    • Verifier Agent: 负责验证输出、任务和格式,检测不一致性、数值错误和幻觉现象。
    • Editor Agent: 根据验证智能体的反馈修订和优化输出,直至达到质量标准。
    • Rounds: 通过评分验证循环实施迭代式质量改进。
    • Loops: 在关键的可靠性检查点,通过受控反馈循环确保准确性。

    后续我们将会逐步带来AI智能体的实战分享,敬请期待!

    4.参考材料

    【1】Introduction - Upsonic

    【2】https://github.com/Upsonic/Upsonic

    【3】LLM Agents | Prompt Engineering Guide

    评论
    添加红包

    请填写红包祝福语或标题

    红包个数最小为10个

    红包金额最低5元

    当前余额3.43前往充值 >
    需支付:10.00
    成就一亿技术人!
    领取后你会自动成为博主和红包主的粉丝 规则
    hope_wisdom
    发出的红包

    打赏作者

    源泉的小广场

    感谢大佬的支持和鼓励!

    ¥1 ¥2 ¥4 ¥6 ¥10 ¥20
    扫码支付:¥1
    获取中
    扫码支付

    您的余额不足,请更换扫码支付或充值

    打赏作者

    实付
    使用余额支付
    点击重新获取
    扫码支付
    钱包余额 0

    抵扣说明:

    1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
    2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

    余额充值