OpenAI发布GPT-4.1全新系列模型,性能全面超越GPT-4o

OpenAI发布GPT-4.1全新系列模型,性能全面超越GPT-4o

原创 硅基心脏 硅基心脏 2025年04月15日 02:16 广东

图片

凌晨一点,OpenAI 正式通过 API 形式发布了全新的 GPT-4.1 系列模型,没错,只有 API,没有网页可以使用,包括三个不同定位的版本:GPT-4.1GPT-4.1 mini 和 GPT-4.1 nano

图片

这次的迭代是对现有旗舰模型 GPT-4o 的一次全面超越,尤其在编码、指令遵循和长上下文处理方面实现了显著飞跃。

图片

OpenAI 官方宣称,新的 GPT-4.1 系列“几乎在各个方面”都优于备受好评的 GPT-4o。此次发布的核心提升聚焦于以下几个关键领域

  • 更强的智能与更低的延迟:整体性能得到提升,同时优化了响应速度。

  • 卓越的编码能力:在软件工程基准测试(如 SWE-bench Verified)上表现突出,代码编辑能力(Aider's Polyglot benchmark)和前端开发任务上均有大幅改进。

  • 精准的指令遵循:在理解复杂指令、多轮对话跟踪(MultiChallenge)和格式依从性(IFEval)方面比 GPT-4o 有显著提升。

  • 突破性的长上下文处理:支持高达 100 万个 token 的上下文窗口,远超 GPT-4o 的 128k,并在“大海捞针”(Needle in a Haystack)等测试中展现了全范围的精确信息检索能力。

图片

1. GPT-4.1 (旗舰版):

  • 定位:高性能旗舰模型,专为复杂任务和跨领域问题解决设计,被官方称为比 GPT-4o “更聪明”。

  • 特性:拥有 1,047,576 tokens 的上下文窗口,最大输出 token 数达 32,768,知识截止日期更新至 2024 年 6 月 1 日。

  • 性价比:性价比相较于 GPT-4o 提升了 26%。

图片

2. GPT-4.1 mini (高效版):

  • 定位:中型高性价比模型。

  • 特性:性能接近 GPT-4o,但成本显著降低了 83%,延迟也减少了一半。多模态能力在某些任务上甚至超过了 GPT-4o。

3. GPT-4.1 nano (高速版):

  • 定位:极致轻量、超高速模型。

  • 特性:是目前 最快且最便宜 的模型,特别适用于分类、补全等对延迟和成本极其敏感的简单任务。

同时,OpenAI 也对定价策略进行了调整,旨在提高性价比:

图片

注意:混合均价是考虑了典型输入/输出比例和缓存命中率后的估算参考值。

此外,Prompt 缓存机制的折扣提升至 75%,使用 Batch API 还可再享 50% 折扣,进一步降低了大规模应用成本。

OpenAI 这次 GPT-4.1 系列发布,无疑是大型语言模型发展史上的又一重要里程碑。它不仅带来了性能上的飞跃,更在上下文长度、推理效率和成本效益上实现了结构性优化。

这预示着 AI 将能更稳定、更可控地应用于更复杂的现实世界任务。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

强化学习曾小健

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值