OpenAI于2025年3月11日刚发布了一系列新工具,参见官方公告:https://openai.com/index/new-tools-for-building-agents/https://openai.com/index/new-tools-for-building-agents/(下面文字借助 Grok 3 协助生成)
根据公告,推出的工具有:
-
Web search(网络搜索工具):可在Responses API中使用,适用于gpt-4o和gpt-4o-mini模型,包括引文支持。也在Chat Completions API中通过gpt-4o-search-preview和gpt-4o-mini-search-preview模型提供。在SimpleQA基准测试中,gpt-4o得分90%,gpt-4o-mini得分88%,相比没有搜索的GPT-4.5(63%)有显著提升。定价为gpt-4o-search每1,000次查询30美元,gpt-4o-mini-search每1,000次查询25美元(详情见https://platform.openai.com/docs/pricing)。文档在https://platform.openai.com/docs/guides/tools-web-search,提前体验https://platform.openai.com/playground/chat?preset=17UUXulQ970dEE3jgRfyzSFQ。
-
File search(文件搜索工具):支持多种文件类型,包含查询优化、元数据过滤和自定义重新排序功能,适用于客户支持、法律和编码等领域。可在Responses API和Assistants API中使用,定价为每1,000次查询2.50美元,文件存储每GB每天0.10美元(首GB免费,详情见https://platform.openai.com/docs/pricing)。文档在https://platform.openai.com/docs/guides/tools-file-search,提前体验https://platform.openai.com/playground/chat。
-
Computer use(计算机使用工具):由CUA模型驱动,自动化计算机任务。在OSWorld基准测试中得分38.1%,WebArena 58.1%,WebVoyager 87%。目前为研究预览,仅对使用层级3-5的选定开发者开放(详情见https://platform.openai.com/docs/guides/rate-limits#usage-tiers)。定价为输入3美元/百万token,输出12美元/百万token(详情见https://platform.openai.com/docs/pricing)。文档在https://platform.openai.com/docs/guides/tools-computer-use,示例在https://github.com/openai/openai-cua-quickstart。
-
Responses API:一个新的API原语,结合了Chat Completions和Assistants API的工具使用功能,支持网络搜索、文件搜索和计算机使用。它包括跟踪和评估功能,不单独收费,按标准速率计费(详情见https://platform.openai.com/docs/pricing)。所有开发者今日即可使用,快速入门指南在https://platform.openai.com/docs/quickstart?api-mode=responses。
-
Agents SDK:一个开源工具,简化多Agent 工作流,相对于之前的Swarm框架有所改进。可与Responses API和Chat Completions API一起使用,很快将支持Node.js。目前Python版本立即可用,定价未指定。文档在https://platform.openai.com/docs/guides/agents。
以下是工具的详细对比表:
工具名称 | 功能 | 可用性 | 定价 | 文档链接 |
---|---|---|---|---|
Web search(网络搜索工具) | 提供实时信息和引文,支持gpt-4o和gpt-4o-mini | Responses API预览,Chat Completions可用 | gpt-4o-search $30/1K查询,gpt-4o-mini-search $25/1K查询: https://platform.openai.com/docs/pricing | 文档: https://platform.openai.com/docs/guides/tools-web-search |
File search(文件搜索工具) | 支持多种文件类型,优化查询和元数据过滤 | Responses API和Assistants API可用 | $2.50/1K查询,$0.10/GB/天存储(首GB免费): https://platform.openai.com/docs/pricing | 文档: https://platform.openai.com/docs/guides/tools-file-search |
Computer use(计算机使用工具) | 自动化计算机任务,由CUA模型驱动 | 研究预览,仅层级3-5开发者可用 | 输入$3/1M,输出$12/1M: https://platform.openai.com/docs/pricing | 文档: https://platform.openai.com/docs/guides/tools-computer-use |
Responses API | 结合Chat和Assistants API,支持多种工具使用 | 今日所有开发者可用 | 按标准速率计费: https://platform.openai.com/docs/pricing | 快速入门: https://platform.openai.com/docs/quickstart?api-mode=responses |
Agents SDK | 简化多Agent工作流,开源,支持Python,Node.js即将支持 | Python立即可用 | 未指定 | 文档: https://platform.openai.com/docs/guides/agents |
并且,OpenAI计划在未来几个月内推出更多工具和集成,以帮助开发者部署、评估和优化Agent 应用。此外,Assistants API将在2026年上半年被废弃,OpenAI将提供迁移指南。默认情况下,业务数据不会用于训练模型,详情见https://enterprise-privacy/。
另外,一个值得注意的细节是,计算机使用工具(CUA模型)目前可靠性有限,在OSWorld基准测试中得分仅38.1%,可能不适合自动化操作系统任务。这可能对开发者在生产环境中的应用构成挑战。
这些工具的发布被视为 AI Agent 发展的关键一步,OpenAI CEO Sam Altman在2025年1月曾表示,2025年将是 AI Agent 进入工作场所的一年。这些工具的推出可能加速企业采用AI解决方案,尤其是在客户支持、法律和市场研究等领域。然而,AI代理技术仍处于早期阶段,存在如事实错误(gpt-4o搜索仍有10%错误率)等局限性。
关键引文
-
New tools for building agents Responses API web search file search computer use and Agents SDK
-
OpenAI launches new tools to help businesses build AI agents
-
The new agents SDK Responses API File search Computer use what’s everyone’s thoughts
-
Announcing the Responses API and Computer-Using Agent in Azure AI Foundry
-
OpenAI's new tools help developers build computer-operating AI agents