大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,专注于分享AI全维度知识,包括但不限于AI科普,AI工具测评,AI效率提升,AI行业洞察。关注我,AI之路不迷路,2025我们继续出发。
o3
是OpenAI于12月20日官宣的最新推理模型。
o3
很强,甚至“智商”超过人类(这里的智商特指推理能力)。
在Codeforces竞赛编程平台上,o3
的ELO评分接近2727分,超过了绝大多数人类程序员,包括OpenAI自己的首席科学家Yakov。所以,在o3
刚亮相那会,“99%的程序员即将被AI取代”这种言论甚嚣尘上。然而,这些人可能想多了,因为,o3虽强,你可能压根用不起!
据TechCrunch报道,o3
作为迄今为止最强大的AI模型,其单次查询成本超过了1000美元!
比人类更“聪明”,比黄金更“昂贵”
“o3
是一个能够适应它以前从未遇到过的任务的系统,可以说在ARC-AGI领域接近人类水平的表现,”ARC-AGI基准测试的创建者François Chollet在博客中写道。“当然,这种通用性是以高昂的代价为代价的,而且还不太经济:你可以付钱让人类以大约每个任务5美元的价格解决ARC-AGI任务(我们知道,我们就是这么做的),而消耗的能量只有几美分。”
没错,o3
模型的强大性能是建立在令人咋舌的计算资源消耗之上的。如果将o3
的推理过程比作一场头脑风暴,那么这场风暴的代价足以让大多数公司破产。根据Chollet披露,o3
在其最高性能模式下,完成一次任务需要消耗价值超过1000美元的计算资源!而雇佣一位人类专家来完成同样的任务,成本大约只需要5美元,还不需要消耗电费...
即使是o3
的“经济适用”版本o3-mini
,每次任务的成本也在20美元左右,这依然是一个让人望而却步的数字。试想一下,如果你要求ChatGPT做的每一个任务都需要支付20美元的费用,那么稍微用一用,每月的总费用就将是一个天文数字。而OpenAI自家的ChatGPT Plus,每月收费也不过20美元,在o3
面前简直是小巫见大巫。
下图展示了OpenAI的o
系列模型在ARC-AGI基准测试上的性能与成本对比(数据来源:ARC Prize)。
“军备竞赛”下的AI,离普通人越来越远
o3
的出现,预示着当前AI领域可能陷入了一种“军备竞赛”的怪圈。随着各大科技巨头争先恐后地推出性能更强、参数更大的模型,这些模型的使用成本却越来越高,逐渐脱离了普通用户的承受范围。这种发展模式显然是不可持续的。
一方面,性能的提升确实带来了AI“智商”的飞跃,o3
在某些特定任务上甚至超越了人类的推理能力,这无疑是令人兴奋的。但另一方面,如果AI的发展仅仅是为了在各种基准测试中刷分,而忽略了实际应用的可行性和经济性,那么这种进步的意义很明显已经脱离了OpenAI每天高喊的使命:ensure that artificial general intelligence benefits all of humanity,确保AGI造福全人类。
AI应该真正成为一种普惠的技术,而不是少数巨头才能玩得起的奢侈品。
Chollet本人也对未来充满希望,他相信“成本效益可能会在未来几个月和几年内得到极大的改善。” 但这无疑需要整个AI领域的共同努力。
-
算法创新: 开发更高效的推理算法,在保证性能的同时降低计算需求。例如,探索新的模型架构、知识蒸馏等技术。
-
硬件突破: 研发更适合AI推理的芯片,提高能效比,降低单位计算成本。目前,像Groq、Cerebras等公司正在这一领域进行探索。
-
模型优化: 对现有模型进行剪枝、量化等操作,减少模型的大小和计算量,使其更易于部署和使用。
-
应用导向: 从实际应用场景出发,设计和训练AI模型,避免为了追求通用性而造成不必要的资源浪费。
结语
别想多了,o3
暂时还取代不了你。
精选推荐
都读到这里了,点个赞鼓励一下吧,小手一赞,年薪百万!😊👍👍👍。关注我,AI之路不迷路,原创技术文章第一时间推送🤖。