OpenAI放大招!智能体API横空出世,网络/文件搜索、计算机操作一网打尽

智能体时代来临,OpenAI引领变革

智能体时代来临

“智能体(Agent)”无疑是当今AI领域最炙手可热的话题。各家科技巨头纷纷布局智能体领域,力图在这个新兴赛道抢占先机。近日,OpenAI发布了一系列可让开发者通过API构建智能体的新工具,再次引领了AI领域的变革。

🚀 Responses API:Chat Completions的“超级进化”

Chat Completions的“超级进化”

在OpenAI发布的众多新工具中,最引人瞩目的莫过于Responses API。它是对之前的Chat Completions API的一轮重大升级,使其获得了Assistants API般使用工具的能力,从而可以帮助开发者构建智能体。

OpenAI CEO Sam Altman表示,Chat Completions API是有史以来设计最完善、最实用的API之一。它对行业标准化做出了巨大贡献,被许多大模型提供商所兼容。而如今发布的Responses API,或许也将成为智能体响应标准化的重要组成部分。

Responses API的核心优势
  • 简洁性与功能性的完美结合: Responses API将Chat Completions的简单性与Assistants API的工具使用功能融为一体,为开发者提供了更灵活的基础。
  • 内置强大工具: Responses API内置了网络搜索、文件搜索和计算机使用(computer use)等强大工具,可以将模型连接到现实世界,完成更有用的任务。
  • 可用性改进: Responses API采用了统一的基于事项(item)的设计,具有更简单的多态性、直观的流式事件和SDK助手,方便开发者使用。
  • 数据存储与评估: Responses API使在OpenAI上存储数据变得更加容易,开发者可以使用跟踪和评估等功能来评估智能体性能。OpenAI强调,即使数据存储在OpenAI上,也不会默认使用业务数据来训练模型。
Responses API与现有API的关系
  • Chat Completions API: OpenAI表示,Chat Completions仍然是他们最广泛采用的API,并将继续支持它。对于不需要内置工具的开发者,可以继续使用Chat Completions。Responses API是Chat Completions的超集,具有同样出色的性能,对于新的集成,OpenAI建议从Responses API开始。
  • Assistants API: OpenAI在Responses API中加入了许多关键改进,使其更灵活、更快、更易用。OpenAI正在努力实现Assistants和Responses API之间的完全功能对等,并计划在2026年中期正式弃用Assistants API。在正式宣布弃用之前,OpenAI将继续让新模型支持Assistants API。

🛠️ Responses API的内置工具:连接现实世界的桥梁

Responses API内置了三大工具:网络搜索、文件搜索和Computer Use,它们可以将模型连接到现实世界,完成更复杂的任务。

1. 网络搜索:获取实时信息,提供可靠来源

开发者现在可以从网络上获得快速、最新的答案,同时还带有清晰且相关的引文。网络搜索工具使用了与ChatGPT搜索一样的模型,并在SimpleQA基准测试上取得了优异的成绩。

2. 文件搜索:轻松检索文档信息,支持多种格式

开发者可以使用经过改进的文件搜索工具轻松地从大量文档中检索相关信息。它支持多种文件类型、查询优化、元数据过滤和自定义重新排名,并能提供快速、准确的搜索结果。

3. Computer Use:让AI操作计算机,实现自动化任务

Computer Use工具使用了Computer-Using Agent(CUA)模型,可以在OSWorld、WebArena和WebVoyager等基准测试上取得SOTA结果。它可以捕获模型生成的鼠标和键盘操作,使开发者能够通过将这些操作直接转换为其环境中的可执行命令来自动执行Computer Use任务。

⚙️ Agents SDK:编排智能体工作流的利器

除了构建智能体的核心逻辑并让它们能够访问有用的工具之外,开发者还需要编排智能体工作流。OpenAI开源发布的Agents SDK可以简化多智能体工作流的编排,并相比于Swarm有了显著的改进。

Agents SDK具有以下特点:

  • 易于配置的智能体: 具有清晰的说明和内置工具。
  • 智能交接: 在智能体之间智能地转移控制权。
  • 安全护栏: 可配置的安全检查,用于输入和输出验证。
  • 跟踪与可观察性: 可视化智能体执行跟踪以调试和优化性能。

Agents SDK可以与Responses API和Chat Completions API配合使用,也可以与其他提供商的模型配合使用。

🌟 Responses API背后的故事

Responses API的设计者之一、OpenAI的Atty Eleti分享了Responses API背后的故事。他表示,Responses API是他设计OpenAI API两年经验的积累成果。

Responses API的设计哲学是:交付能力,而非抽象(Ship capabilities, not abstractions.)。

结语:智能体的未来,由你我共创

OpenAI的智能体API和相关工具的发布,为开发者构建智能体应用提供了强大的支持。随着AI技术的不断发展,智能体将在各行各业发挥越来越重要的作用。让我们共同期待,智能体将如何改变我们的工作和生活,创造更美好的未来!

想玩转AI大模型? ChatTools 一站式体验GPT-4o、Claude 3、Midjourney等!特别是Midjourney,免费无限生图,快来释放你的创造力!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值