【AI前沿】OpenAI隆重发布 GPT-4.5 —— 新一代对话模型强势来袭


2025年2月27日凌晨4点,OpenAI举行了低调而别具风格的 GPT-4.5 专场直播。尽管现场布置简朴,仅在一个朴实无华的小房间内进行,但这款新一代对话模型的发布依然引发了广泛关注。距 2023 年 GPT-4 惊艳问世已近两年,业界对下一代 GPT 模型的期待始终未曾停歇。而今天,OpenAI终于带来了这款号称目前最强大的 GPT 模型研究预览版。

在这里插入图片描述

技术革新与突破

GPT-4.5 在预训练与后训练阶段实现了前所未有的规模化突破,充分扩展了无监督学习与推理能力的双向潜力。借助 Microsoft Azure AI 超级计算机强大的算力,该模型在识别模式、建立关联和生成创造性见解方面均有显著提升。不仅如此,SimpleQA 等多项评测显示,GPT-4.5 的幻觉率已从 GPT-4 的近 61.8% 降低至 37.1%,准确率提升至 62.5%,在世界知识与信息可靠性上达到了 OpenAI 家族中的新高度。

特别值得一提的是,对于“人类的第一种语言是什么”这一世纪难题,早期版本往往给出抽象或不完整的回答,而 GPT-4.5 则敢于坦诚:
“我不知道,这是一个未解之谜。”
这一诚实的回应在业内被视为模型真实理解能力的重要体现。

参数数据与评测对比

在发布现场,部分评测数据引发热议。根据 AIME 2024 基准测试,GPT-4.5 得分为 36.7%,相比此前 GPT-4o 的 9.3% 有大幅提升;但令人费解的是,早期 GPT-4o 的 AIME 得分曾达到 13.4 分,如今却下降了 4 个点,这一变化引起了业内专家的讨论。此外,另一个基准中,o3-mini(high)的得分依旧保持在 87.3%,显示出各模型在不同任务和数据集上的表现参差不齐,反映出整个大语言模型领域依然存在多样化的发展趋势。

全新体验与应用场景

GPT-4.5 在情感理解和自然对话方面的表现尤为亮眼。许多用户反馈,其在处理情感支持和生活化对话时,展现了更高的情商与温度。例如,在面对“朋友总是爽约,我想发短信表达愤怒但又不想绝交”这样的情感纠结时,GPT-4.5 能给出更细腻、更体贴的建议,避免了以往那种生硬、公式化的回答。

与此同时,该模型还支持联网搜索、文件和图片上传以及全新 Canvas 功能,极大拓展了写作、编程和设计等领域的应用场景。然而,与 GPT-4 相比,GPT-4.5 目前仍不支持语音、视频或屏幕共享等多模态交互;部分用户还反映,在回答某些史实性问题时,模型会强制触发搜索模式,导致体验略显“离谱”。

在代码和逻辑推理任务上,虽然 GPT-4.5 整体能力不俗,但在部分简单逻辑问题上表现出现困惑;而在经典物理问题的测试中,其表现虽与 Claude 3.7、Grok3、R1 等模型相比并无明显优势,但也显示出 OpenAI 对多任务综合能力的不懈追求。

定价策略与市场反响

令人瞩目的不仅是技术参数,更有令人咋舌的定价。根据公开信息,GPT-4.5 的定价为每百万输入 75 美元、每百万输出 150 美元。相比之下,竞争对手 Claude 3.7 的成本仅为每百万输入 3 美元、输出 15 美元,而 DeepSeek v3 的费用更是低至每百万输入仅 0.27 美元、输出 1.1 美元。如此悬殊的价格差异,使不少用户和业内专家质疑:在成本与性能的平衡上,OpenAI 是否真正能为用户提供足够的性价比?

目前,GPT-4.5 已以研究预览版形式面向每月 200 美元的 ChatGPT Pro 用户开放,并将于未来几日内逐步向 Plus、Team 用户以及企业和教育用户扩展;同时,通过 Chat Completions API、Assistants API 和 Batch API 的预览版,所有付费开发者也可第一时间体验这一新模型。

竞争压力与未来展望

在激烈的 AI 市场竞争中,尽管 GPT-4.5 在情感理解、知识覆盖等方面取得了突破,但其发布现场相较于以往 GPT-4 和 GPT-4o 那种令人震撼的多模态实机演示,显得低调甚至有些“疲态”。有业内人士直言:如果 OpenAI 继续步履缓慢,身边的竞争者可能会呼啸而过;唯有真抓实干、不断创新,才能赢得用户信任和市场青睐。

业内传闻称,奥特曼式的宣传已成为过去式,未来的 GPT-5 可能将整合 o3 等多款模型的优势,采用混合架构来进一步突破现有技术瓶颈。对于此次 GPT-4.5 的表现,既有赞誉也有批评——有人认为它在情感表达和用户互动上已迈出重要步伐,也有人对其缓慢的响应速度和高昂的成本表示失望。

总结

总的来说,GPT-4.5 的发布既彰显了 OpenAI 在大规模语言模型研发方面不断突破的决心,也暴露出在定价、性能细节和用户体验上仍需改进的现实问题。作为目前最强大的 GPT 模型研究预览版,GPT-4.5 为未来人工智能对话系统的发展提供了宝贵的探索方向,但也提醒我们,在这场 AI 长跑中,只有不断加速、不断创新,才能在竞争中立于不败之地。

OpenAI 是否能在下一次更新中重拾昔日惊艳,或在激烈竞争中实现真正“觉醒”,让我们拭目以待。正如业内所言——在 AI 领域,只有实力与诚意并存,用户才会为之买单;否则,营销和摆谱只会成为被淘汰的理由。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

阿呆591

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值