OpenAI推出GPT-4.5：最强知识型模型，“AI味”、幻觉大幅减少-CSDN博客

来源：腾讯科技

2月28日消息，OpenAI今日宣布推出其最新旗舰产品GPT-4.5语言模型。

这款被称为“迄今为止知识储备最丰富”的AI系统将率先面向Pro用户和开发者开放研究预览（research preview）。官方特别说明，该模型并非前沿架构版本，在部分场景下的表现可能不及o1或o3-mini等尖端模型。

从即日起，ChatGPT Pro用户可以在网页端、移动端和桌面端的模型选择器中选择GPT-4.5。该模型将于下周开始向Plus和Team用户推出，随后的一周向企业和教育用户推出。

GPT-4.5可以访问最新的信息，支持搜索、文件和图像上传，并能通过画布进行写作和代码编辑，目前不支持ChatGPT中的多模态功能，如语音模式、视频和屏幕共享。

此外，OpenAI还在Chat Completions API、Assistants API和Batch API中向所有付费用户层级的开发者预览GPT-4.5，支持关键功能，如函数调用、结构化输出、流式传输和系统消息。它还通过图像输入支持视觉能力。

OpenAI指出，GPT-4.5是一个非常庞大且计算密集的模型，其使用成本比GPT-4o更高，且并非后者的替代品。

GPT-4.5在预训练和后期训练方面取得了重大突破，通过扩大无监督学习的规模，GPT-4.5提高了识别模式、建立联系以及生成创造性见解的能力，且这一过程无需直接推理。

早期的测试显示，用户与GPT-4.5互动时感觉更加自然。其更广泛的知识库、对用户意图的改进理解以及更高的“情商”（EQ）使其在提高写作、编程和解决实际问题等任务中表现出色。同时，OpenAI预期GPT-4.5的虚构信息将更少，甚至略低于其o1模型。

在SimpleQA（简单问答）测试中，GPT-4.5在准确性和虚构信息率方面均表现优异

按照山姆·奥特曼披露的信息，OpenAI计划在2月结束前推出GPT-4.5，并在5月底前推出GPT-5。

OpenAI首席执行官山姆·奥特曼（Sam Altman）曾把GPT-5称为“整合了我们众多技术的系统”，它将包含OpenAI在去年12月的“圣诞十二日”活动中展示的新o3推理模型。

此前，OpenAI发布了o3-mini，但完整的o3模型仅会作为即将推出的GPT-5系统的一部分推出。这与OpenAI的目标一致，即整合其大型语言模型，最终打造一个有望被视为通用人工智能（AGI）的更强大模型。

无监督学习提高模型的准确性和直觉

OpenAI通过扩展两种互补范式来提升AI能力：无监督学习和推理，两者代表了智能的两个不同维度。

推理能力的扩展教会了模型在回应之前进行思考和产生思维链，从而使它们能够解决复杂的科学、技术、工程和数学（STEM）或逻辑问题。OpenAI o1和OpenAI o3mini等模型就是这一范式的代表。

相对而言，无监督学习提高了世界模型的准确性和直觉。

当询问GPT-4.5“第一种语言是什么时，”它给出的答案是：“我们尚不完全清楚第一种语言是什么，并引用各方观点供用户参考。

GPT-4.5通过扩展计算和数据规模，以及架构和优化创新，实现了无监督学习的扩展。结果是，该模型拥有更广泛的知识和对世界的更深刻理解，从而减少了虚构信息，并在广泛的主题上提高了可靠性。

对话更加符合人类协作的需求

随着OpenAI的研究人员扩大模型规模并解决更复杂的问题，教会它们更好地理解人类需求和意图变得越来越重要。

对于GPT-4.5，研究人员开发了新的可扩展技术，这些技术使得能够利用较小模型的数据来训练更大、更强大的模型。这些技术提高了GPT-4.5的可操控性、对细微差别的理解以及自然对话的能力。

在与人类测试者的比较中，GPT-4.5在创意智力、专业查询和日常查询方面均表现出较高的胜率

将对世界的深刻理解与改进后的协作能力相结合，GPT-4.5能够在温暖且直观的对话中自然地整合想法，这些对话更加符合人类协作的需求。

GPT-4.5的回答更像是一个正常人

OpenAI展示了GPT-4.5和GPT-4o处理三个相同问题的结果：

问题一：困难时期的帮助

用户‌称，“我考试不及格，现在很难过。” GPT-4.5的回答拥有更好的情感代入，相比4o机械式给解决方案，“AI味”少了很多。

‌问题二：太空探索

用户‌问“你对太空探索有什么看法？”GPT-4.5的回答更像是一个正常人，输出自己的见解和观点，GPT-4o的回答则引经据典，过于学究。

推理能力将是未来模型的核心能力

GPT-4.5在响应时不进行预先推理，这使得它的优势与OpenAI的o1等推理模型截然不同。与OpenAI的o1和o3-mini相比，GPT-4.5是一个更通用、更智能的模型。

OpenAI相信，推理能力将是未来模型的核心能力，而预训练和推理这两种扩展方法将相互补充。

随着像GPT-4.5这样的模型通过预训练变得更智能、更博学，它们将成为推理和工具使用代理的更强大基础。

模型能力提升带来安全性提高

模型能力的每一次提升，也是使其更安全的契机。GPT-4.5采用了新的监督训练技术，结合了传统的监督微调（SFT）和人类反馈强化学习（RLHF）方法，与GPT-4o所使用的方法类似。OpenAI希望这些工作能为未来更强大的模型对齐提供基础。

为了测试OpenAI的改进，研究人员在部署前根据他们的准备框架进行了一系列安全测试。结果发现，扩展GPT范式有助于提升GPT-4.5在各项评估中的能力。（腾讯科技特约编译无忌）

阅读最新前沿科技趋势报告，请访问欧米伽研究所的“未来知识库”

https://wx.zsxq.com/group/454854145828

未来知识库是“欧米伽未来研究所”建立的在线知识库平台，收藏的资料范围包括人工智能、脑科学、互联网、超级智能，数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828 进入。