GPT-4.5正式发布,分享技术报告原文!
当地时间 2 月 27 日,OpenAI 正式发布了其最新的聊天模型 GPT-4.5,这也是该公司目前为止规模最大的模型。此次发布仅通过一段 13 分钟的视频进行,OpenAI 首席执行官山姆・奥特曼(Sam Altman)并未现身。
据 OpenAI 研究副总裁 Mia Glaese 介绍,GPT-4.5 的独特之处在于它能够进行热情、直观且自然流畅的对话,并且对用户需求的理解能力更强。奥特曼在发布前发文表示,GPT-4.5 是首个给他与有思想的人交谈感觉的模型,“有好几次,我从这个人工智能那里得到了非常好的建议,让我感到惊讶”。但他也指出,这是一个庞大且昂贵的模型,由于公司规模不断扩大,目前已耗尽 GPU 资源,下周将增加数万个 GPU,随后会向 Plus 层级的用户推出。
GPT-4.5 在预训练和后训练的扩展方面取得了新进展。通过扩展无监督学习,它提升了识别模式、建立联系以及在无需推理的情况下生成创造性见解的能力。推理能力的扩展使模型在回应前能够进行思考并产生思维链,从而处理复杂的科学、技术、工程和数学(STEM)或逻辑问题;无监督学习则提高了世界模型的准确性和直觉性。通过扩大计算资源和数据量,以及架构和优化方面的创新,GPT-4.5 在微软 Azure AI 超级计算机上进行训练,拥有了更广泛的知识和对世界更深入的理解,在众多话题上减少了幻觉现象并提高了可靠性。
同时,GPT-4.5 的可操控性、对细微差别的理解能力以及自然对话能力都得到了提升。OpenAI 称,将世界模型的深入理解与改进后的协作能力相结合,使得 GPT-4.5 能够在 “温暖且自然” 的对话中自然地整合想法,对人类意图的理解更加深刻,能够更细腻、更具 “情商” 地解读微妙的暗示或隐含期望。此外,GPT-4.5 还表现出更强的审美直觉和创造力,在写作和设计辅助方面表现出色。在人类偏好测试中,相比于 GPT-4o,更多人愿意选择 GPT-4.5。
目前,GPT-4.5 不支持语音模式、视频和屏幕共享等多模态功能,且仅向 Pro 用户开放,下周开始将向 Plus 和 Team 用户推出,再下周向 Enterprise 和 Edu 用户推出。开发者可以直接在 API 中调用,但输入 token 定价比 GPT-4o 贵了 30 倍,输出 token 贵了 15 倍。
在多项基准测试中,GPT-4.5 得分均超过 GPT-4o 和 o3-mini,但在数学和科学测试中不及推理模型 o3-mini。OpenAI 表示,推理将成为未来模型的核心能力,并且预训练和推理两种扩展方式将相互补充。随着像 GPT-4.5 这样的模型通过预训练变得更加智能,它们将为推理和使用工具的智能体(Agent)提供更强大的基础。
根据此前奥特曼公布的产品路线图,OpenAI 在 GPT-4.5 发布后,将在数月内在 ChatGPT 和 API 中发布 GPT-5,作为集成 OpenAI 各项技术(包括推理模型 o3)的系统。免费版 ChatGPT 将在标准智能设置下获得对 GPT-5 的无限制聊天访问,Plus 用户将能够以更高智能水平运行 GPT-5,Pro 用户将能使用更高的智能水平。这些模型将融合 OpenAI 此前陆续推出的语音、canvas、搜索、DeepResearch 等功能。
分享GPT-4.5的技术报告原文