OpenAI 推出系列新工具，简化 AI Agent 的开发

本文链接：https://blog.csdn.net/debug_fan/article/details/146214219

OpenAI于2025年3月11日刚发布了一系列新工具，参见官方公告：https://openai.com/index/new-tools-for-building-agents/https://openai.com/index/new-tools-for-building-agents/（下面文字借助 Grok 3 协助生成）

根据公告，推出的工具有：

Web search（网络搜索工具）：可在Responses API中使用，适用于gpt-4o和gpt-4o-mini模型，包括引文支持。也在Chat Completions API中通过gpt-4o-search-preview和gpt-4o-mini-search-preview模型提供。在SimpleQA基准测试中，gpt-4o得分90%，gpt-4o-mini得分88%，相比没有搜索的GPT-4.5（63%）有显著提升。定价为gpt-4o-search每1,000次查询30美元，gpt-4o-mini-search每1,000次查询25美元（详情见https://platform.openai.com/docs/pricing）。文档在https://platform.openai.com/docs/guides/tools-web-search，提前体验https://platform.openai.com/playground/chat?preset=17UUXulQ970dEE3jgRfyzSFQ。
File search（文件搜索工具）：支持多种文件类型，包含查询优化、元数据过滤和自定义重新排序功能，适用于客户支持、法律和编码等领域。可在Responses API和Assistants API中使用，定价为每1,000次查询2.50美元，文件存储每GB每天0.10美元（首GB免费，详情见https://platform.openai.com/docs/pricing）。文档在https://platform.openai.com/docs/guides/tools-file-search，提前体验https://platform.openai.com/playground/chat。
Computer use（计算机使用工具）：由CUA模型驱动，自动化计算机任务。在OSWorld基准测试中得分38.1%，WebArena 58.1%，WebVoyager 87%。目前为研究预览，仅对使用层级3-5的选定开发者开放（详情见https://platform.openai.com/docs/guides/rate-limits#usage-tiers）。定价为输入3美元/百万token，输出12美元/百万token（详情见https://platform.openai.com/docs/pricing）。文档在https://platform.openai.com/docs/guides/tools-computer-use，示例在https://github.com/openai/openai-cua-quickstart。
Responses API：一个新的API原语，结合了Chat Completions和Assistants API的工具使用功能，支持网络搜索、文件搜索和计算机使用。它包括跟踪和评估功能，不单独收费，按标准速率计费（详情见https://platform.openai.com/docs/pricing）。所有开发者今日即可使用，快速入门指南在https://platform.openai.com/docs/quickstart?api-mode=responses。
Agents SDK：一个开源工具，简化多Agent 工作流，相对于之前的Swarm框架有所改进。可与Responses API和Chat Completions API一起使用，很快将支持Node.js。目前Python版本立即可用，定价未指定。文档在https://platform.openai.com/docs/guides/agents。

以下是工具的详细对比表：

工具名称	功能	可用性	定价	文档链接
Web search（网络搜索工具）	提供实时信息和引文，支持gpt-4o和gpt-4o-mini	Responses API预览，Chat Completions可用	gpt-4o-search $30/1K查询，gpt-4o-mini-search $25/1K查询： https://platform.openai.com/docs/pricing	文档： https://platform.openai.com/docs/guides/tools-web-search
File search（文件搜索工具）	支持多种文件类型，优化查询和元数据过滤	Responses API和Assistants API可用	$2.50/1K查询，$0.10/GB/天存储（首GB免费）： https://platform.openai.com/docs/pricing	文档： https://platform.openai.com/docs/guides/tools-file-search
Computer use（计算机使用工具）	自动化计算机任务，由CUA模型驱动	研究预览，仅层级3-5开发者可用	输入$3/1M，输出$12/1M： https://platform.openai.com/docs/pricing	文档： https://platform.openai.com/docs/guides/tools-computer-use
Responses API	结合Chat和Assistants API，支持多种工具使用	今日所有开发者可用	按标准速率计费： https://platform.openai.com/docs/pricing	快速入门： https://platform.openai.com/docs/quickstart?api-mode=responses
Agents SDK	简化多Agent工作流，开源，支持Python，Node.js即将支持	Python立即可用	未指定	文档： https://platform.openai.com/docs/guides/agents

并且，OpenAI计划在未来几个月内推出更多工具和集成，以帮助开发者部署、评估和优化Agent 应用。此外，Assistants API将在2026年上半年被废弃，OpenAI将提供迁移指南。默认情况下，业务数据不会用于训练模型，详情见https://enterprise-privacy/。

另外，一个值得注意的细节是，计算机使用工具（CUA模型）目前可靠性有限，在OSWorld基准测试中得分仅38.1%，可能不适合自动化操作系统任务。这可能对开发者在生产环境中的应用构成挑战。

这些工具的发布被视为 AI Agent 发展的关键一步，OpenAI CEO Sam Altman在2025年1月曾表示，2025年将是 AI Agent 进入工作场所的一年。这些工具的推出可能加速企业采用AI解决方案，尤其是在客户支持、法律和市场研究等领域。然而，AI代理技术仍处于早期阶段，存在如事实错误（gpt-4o搜索仍有10%错误率）等局限性。

关键引文