一、GPT‑4.1发布
4月15日,OpenAI在API中推出了三款新车型:GPT‑4.1、GPT‑4.1 mini和GPT‑4.1 nano。
- GPT‑4.1 nano:迄今为止最便宜、速度最快的模型,适合低延迟的简单任务;
- GPT-4.1 mini:能力与之前的GPT-4o旗鼓相当,但延迟降低了近一半,成本降低了 83%;
- GPT‑4.1:ChatGPT4o的全面升级,编码、指令遵循、图像理解、学术知识、上下文长度、价格等诸多方面提升明显。
如下图所示:
横坐标latency(延迟)、纵坐标intelligence(智能),GPT-4.1比GPT-4o强了一点,而4.1 mini则超出了4o mini一大截。
OpenAI表示,史上最贵模型GPT‑4.5预览版将在3个月后,即2025年7月14日关闭,取而代之的是GPT-4.1。
很明显,这次更新的主角是GPT-4.1模型。
二、编码
GPT-4.1在各种编码任务上明显优于GPT-4o,主要体现在以下几个方面:
- 前端编码能力增强:在处理前端开发任务时表现出更高的准确性和效率,能够更好地理解和生成相关代码。
- 减少不必要的编辑:GPT-4.1在生成代码时,能够避免多余的修改,保持代码的简洁性和可读性。
- 可靠地遵循不同的格式:模型能够准确地生成符合不同格式的代码更改,方便开发者进行版本控制和代码审查。
- 确保工具使用的一致性:GPT-4.1 在使用开发工具和库时,能够保持一致性,减少因工具使用不当导致的错误。
在测试实际软件工程技能的sw-bench Verified测试中,GPT‑4.1完成了54.6%的任务,而GPT‑4o(2024-11-20)完成了33.2%的任务,甚至比OpenAI史上最贵模型GPT-4.5高出17%,简直离谱。 这反映了模型探索代码存储库、完成任务和生成运行并通过测试的代码的能力的改进。
GPT-4.1在前端编码方面也大大改进了GPT-4o,并且能够创建功能更强大、更美观的web应用程序。在 head-to-head 对比中,GPT-4.1 的网站比 GPT-4o 的网站更受欢迎。
在小球物理运动测试中,GPT-4.1精准模拟了小球物理运动过程,GPT-4.1-mini/GPT-4.1-nano却差了很多意思。
小球运动。。。。。。。。。。。。。
三、指令遵循
根据开发者的反馈,对GPT-4.1在各种指令遵循方面进行了针对性的改进:
- 不再胡说八道,如果请求的信息不可用,或者没有一个明确的答案,GPT4.1会直接返回“我不知道”或类似的话。不会根据提示词而改变最初的回答。
- 支持负面指定,比如避免某某行为
- 可以执行指定顺序的指令,支持以指定顺序输出内容
- 支持返回指定格式的数据,比如XML、YAML、Markdown等。
四、上下文长度
GPT-4.1、GPT-4.1 mini和GPT-4.1 nano可处理多达100万个上下文令牌,而之前的GPT - 40车型可处理12.8万个上下文令牌。100万个令牌比整个React代码库的8个副本还多,所以长上下文非常适合处理大型代码库或大量长文档。
GPT-4.1 在上下文长度高达 128K 个 token 时的表现优于 GPT-4o,并且即使长度高达 100 万个 token 时也能保持强劲的性能。
五、图像理解
GPT-4.1系列在图像理解方面非常强大,特别是GPT-4.1代表了一个重大飞跃,在图像基准测试中经常超过GPT-4o。
国内直接使用最新GPT4.1、GPT-4.5、满血ChatGPT4o、o1、o3-mini-high、满血DeepSeek R1、马斯克Grok 3
✅️ChatGPT使用地址:www.nezhasoft.cloud
1、纯原版ChatGPT、Claude
✅️官网原生页面
✅️真实Team会员账号
2、技术支持
✔️支持最新GPT-4.1、ChatGPT-4.5、满血ChatGPT-4o(AI绘画不降智)、o1、o3-mini、o3-mini-high、o1 pro
✔️满血DeepSeek R1、马斯克Grok 3
✔️无需魔法、个人独享
3、支持所有GPTs + 自定义插件
支持ChatGPT所有插件,可创建自己的ChatGPT插件,使用朋友分享的自定义插件。
例如最强编程插件Code Copilot、AI绘画插件DALL-E、论文专属Consensus。