GPT-4.5震撼发布:参数爆表,知识满级,贵到离谱!

好消息,代号为 “Orion” 的 GPT-4.5 已于北京时间今天凌晨5点正式发布。

坏消息,GPT-4.5 目前仅对每月200美元的 ChatGPT Pro 用户开放。

同时发布的,还有 GPT-4.5 的 API服务。然而,它的价格,马斯克见了都得摇头,那是相当的高,离谱的高。

1. 扩展无监督学习(Scaling Unsupervised Learning)

推理模型通过内部思维链(Internal Chain of Thought)增强了“解难题”的能力,因为模型学会了先思考,再回答。

作为最后一个“单步推理”(Non-Chain-of-Thought)模型,GPT-4.5 是对无监督学习(Unsupervised Learning)的扩展。讲人话,就是 GPT-4.5 走的还是以前的老路,通过扩大参数量和训练数据规模,猛砸算力来实现性能提升。

这是在 DeepSeek 横空出世前最流行的路子。

GPT-4.5 在微软 Azure AI 超级计算机上完成训练,是迄今为止参数量最大、知识最丰富的模型,没有之一,毕竟是钱和数据砸出来的。

这种无监督学习的路径最大的作用就是提高模型的准确性和直觉。换句话说,减少模型幻觉。

来看这个例子。

当被问到“第一种语言是什么?”时,各个 GPT 系列模型的表现。

GPT-1(2018):无法回答,全程懵逼。

GPT-2(2019):开始一本正经的“胡说八道”。

GPT-3.5T(2023):表示问题“很有挑战”。

GPT-4T(2023):和上面的 GPT-3.5 的回答差不多,表示这个问题有挑战。

GPT-4.5(2025):摆事实,讲道理。

2. 丰富的世界知识

GPT-4.5 拥有全世界最丰富的知识,不过分。

SimpleQA 基准测试用来测试那些看似简单但实际有挑战的知识问题。

GPT-4.5 力压前代模型 GPT-4oo1o3-mini,取得 62.5% 的最好成绩。同时,幻觉最少。

3. 更懂你和你的需求

OpenAI 表示 GPT-4.5 的训练中使用了一种全新的、可拓展的技术来有效利用从其他小参数模型中导出的训练数据。结果就是,GPT-4.5 的可控性、对细微差别的理解和自然对话能力更强。

大白话,现在的 GPT-4.5 更懂你和你的需求。

在由真人模拟的人类偏好测试中,GPT-4.5 在日常查询、专业查询和创意问题中都打败了前代模型 GPT-4o

用 OpenAI 自己的话说就是,GPT-4.5 的情商(EQ)更高。用户与 GPT-4.5 互动会感觉更自然。

比如当你告诉 GPT-4.5 “我考试挂了”时,它会像一个真正的朋友一样安慰你,然后询问你是不是想要聊一聊。而不是粗暴的给出一大堆冰冷的机械的解决方案。

好家伙,卷不动硬实力,开始卷软技能了是吧。

然而,在富有情感的对话方面,马斯克旗下的 xAI 显然更有经验。

xAI 的旗舰产品 Grok 在研发初期就被设计为“最大限度追求真相”并带有“机智和叛逆”的个性,据说其设计灵感来源于《银河系漫游指南》和 JARVIS(《钢铁侠》中的人工智能助手)。带来的结果就是 Grok 在对话中表现的更幽默,更人性化。

4. 支持与不支持

当下的 GPT-4.5 支持联网搜索,支持多模态输入,如图片和文件,并且支持在 ChatGPT Canvas 中使用 GPT-4.5 进行写作和编程任务。

但,GPT-4.5 不支持高级语音模式、视频聊天、屏幕共享。

5. GPT-4.5 基准测试

GPT-4.5 的基准测试结果和 GPT-4o 比起来,那肯定强的不是一点半点。但在超级难题,比如 AIME 数学竞赛题上,又是打不过 o3-mini-high 这样的推理模型的。毕竟,GPT-4.5 不会思考,没有内置思维链。

6. 怎么用 GPT-4.5

如果是这周,那么有2种方法可以抢先体验 GPT-4.5

  1. 钞能力:开通每月200美元的 ChatGPT Pro 会员,立即可用。

  2. API:以 API 调用的形式配合第三方客户端也可以立刻体验 GPT-4.5

如果是下周,那么 ChatGPT Plus 和 Team 用户也能够开始体验 GPT-4.5

值得一提的是,GPT-4.5 API 要慎用,因为,实在是太贵贵贵了。

GPT-4.5 API 价格为:每百万输入 tokens 75美元,每百万输出 tokens 150美元。这俩加起来就超过 ChatGPT Pro 的月费了。

作为对比,前代模型 GPT-4o 的 API 价格简直是“白菜价”:每百万输入 tokens 2.5美元,每百万输出 tokens 10美元。更不用提“AI 拼多多” DeepSeek 这位大佬了!

结语

划重点,GPT-4.5 不是给你用来做数学题的,它更擅长一些高情商和创意任务,比如写作、学习、沟通、头脑风暴。


我是木易,一个专注AI领域的技术产品经理,国内Top2本科+美国Top10 CS硕士。

相信AI是普通人的“外挂”,致力于分享AI全维度知识。这里有最新的AI科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”,用AI为你的未来加速。

精选推荐​​​​​​​

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值