推出地球上最聪明的AI,马斯克也许不那么聪明

毫无疑问,昨天的发布会让马斯克再次成为了全世界的焦点。

xAI推出的第三代大模型Grok 3,马斯克称其为“地球上最聪明的AI”。而在一系列的基准测试中,Grok 3表现得都非常卓越,在AIME 2024数学竞赛、GPQA科学问答、LCB编码等权威基准测试中,一举刷新了最优解纪录。在LMSYS Arena排行榜上,它更是以超1400的Elo评分稳居榜首。

然而,在AI竞争加速的今天,当我们透过这些耀眼成绩深入探究其背后的故事,则不难发现:Grok 3也许很聪明,马斯克重金打造Grok 3却未必那么聪明。

聪明一时,但生不逢时

从目前已公开的资料来看,Grok 3的突破性的进展主要源于以下三个方面:

首先是训练规模与效率跃升Grok 3的训练量是前代Grok 2的10倍,依托20万张英伟达H100 GPU的算力支持,模型参数量和数据处理能力达到新高度。尽管因团队规模限制导致发布延迟,但其技术参数仍被视为行业标杆。

其次是“思维链”推理能力Grok 3首次引入了“思维链”(Chain of Thought)技术,使其能像人类一样逐步分解复杂任务,提供逻辑连贯的响应。这一能力可能推动AI从“工具”向“协作伙伴”转变,尤其在高复杂度领域展现潜力。

第三是多模态功能强化模型在文本生成、图像分析及编程支持等领域的表现均优于ChatGPT和DeepSeek,尤其是在技术文档生成和代码纠错场景中,准确率提升显著。

但是即便是基于这三个点来看,Grok 3却也未必是无懈可击。

首先是算力成本问题。训练 Grok 3 投入了 20 万张 H100 GPU,如此大规模的算力投入,在 AI 训练领域堪称 “史无前例”。强大的算力为模型训练提供了极为充裕的计算资源,让 Grok 3 得以处理海量数据,进行深层次的神经网络训练,性能也得以超越众多竞争对手。

但在这强大实力的背后,是令人咋舌的巨额成本。目前来看,H100 GPU 单张采购价约 1.3 万美元,仅这一项硬件采购费用就高达26亿美元。除了采购成本,电力供应也是个 “无底洞”。据行业估算,如此规模的 GPU 集群,每天耗电量可达数十万度,一年下来电费支出可能高达数亿美元。场地租赁和设备冷却同样开销巨大,要安置这些设备,需要租赁大面积场地,还要搭建高效的冷却系统,确保 GPU 在合适的温度下稳定运行。

这些巨大的成本最终一定会落在消费人群身上。市场调研机构 Statista 的数据显示,当下 AI 模型订阅服务市场竞争激烈,用户对订阅费用十分敏感。而从现在的订阅价格来看,Grok 3相比ChatGPT要贵一倍以上,但性能的提升却远没有成本提升的这么夸张,对于绝大多数的消费者来说都很难接受为此买单。而且伴随着DeepSeek的异军突起,如今AI模型的竞争已经逐渐从堆卡突破转向了效率突破。

在降本增效的大趋势下,不只是马斯克挥舞镰刀斩向普通员工,也一样会向原本粗放发展的AI大模型砍去。

然后我们来看CoT,该技术能够将复杂问题拆解并进行逻辑推导,在演示过程中,Grok 3 成功解答综合应用题,还能敏锐地纠正数据错误,展现出强大的逻辑思维能力。在编程竞赛题目测试中,Grok 3 的正确率高达 92%,超过了 ChatGPT-4 的 85% 和 DeepSeek-R1 的 88%,推理能力可见一斑。但是,CoT并非全新的技术,如o1、DeepSeek R1等都已经使用了这一技术,显然CoT不能真正成为Grok 3的护城河。

当然,可能更需要关注的点还在于数据方面。“有时候我觉得Grok 3聪明得可怕,如果它发现数据错了,它会反思并删除错误数据。”马斯克表示,xAI是基于合成数据进行训练的,能够通过反复检查数据来反思所犯的错误,从而实现逻辑一致性。但是,合成数据也引发了外界对数据可靠性的质疑。此前已经有专家警告称,主要依赖合成数据可能导致模型与现实脱节,在处理文化敏感问题时容易出现偏差。Grok 2曾因过度依赖合成数据导致真实场景表现不佳,Grok 3虽改进数据策略,仍需验证其稳定性。AI 的发展离不开高质量的数据支撑,数据的真实性和多样性对于模型的准确性和泛化能力至关重要。

争议不断的马斯克与xAI

相比技术上的争议,在场外才是Grok 3被质疑更多的地方。

首先就是发布时间的问题。马斯克早在半年前就宣布了Grok 3即将在2024年底推出,但是在吊足了市场胃口之后,一直到昨天才正式落地。那么这两个月里发生了什么呢?国内的大家想必感触要比海外更加明显,DeepSeek的全面崛起,笔者认识的每个人都在不同的平台中基于DeepSeek发布一系列的内容。可以说,DeepSeek的低成本和开源已经彻底把市场搅乱,对应的也让大量用户对Grok 3的期待值有所降低。

第二个问题就在马斯克和奥特曼之间的明争暗斗。Grok 3在慢慢吞吞,但openAI可没闲着,就在2月12日,奥特曼已经公开了GPT-5的技术路线图,并且承诺会在未来的几周内发布GPT-4.5,这将是 OpenAI 最后一个非模拟推理模型。也难怪有好事者在X上模仿英伟达老黄,说Grok 3只能领先一周左右的时间,因为时间已经真的没在等马斯克了。

此外,马斯克与奥特曼也时常在X上打打嘴仗,2月10日,财大气粗的马斯克出价974亿美元,寻求收购OpenAI。但是奥特曼也不是什么缺钱的主,不仅很快拒绝了马斯克的收购,也反过来在X上开始寻求反向收购,偷马斯克的家。两个人的明争暗斗无疑会给xAI和openAI的竞争增加几分颜色,但是如果接下来openAI真的拿出杀招来,面对一个成本更低性能更优的对手,Grok 3还能风光几时呢?

第三个争议则来自于经典的开源闭源之争。从商业利益角度出发,Grok 3 选择闭源有其合理性。在竞争白热化的 AI 市场中,技术就是企业的核心竞争力。通过闭源,xAI 可以将 Grok 3 的算法、数据和模型结构等关键信息牢牢掌握在自己手中,防止被竞争对手轻易模仿。但是,马斯克并非完全的闭源支持者。Grok1是开源模型,但xAI的开源之路已经止步于此很久了。尽管马斯克承诺会在未来几个月内开源Grok2,只是面对已经被DeepSeek把胃口吊起来的开源用户们,Grok2能有多少吸引力难免要画上一个大大的问号。

第四个争议则来自于xAI的内部管理问题。此前一名xAI员工Kraker在X上发布关于Grok 3代码能力排名的个人观点帖子,但随后不久就公司发现并要求删帖,否则就面临解雇问题。而Kraker也是一刚到底,坚决认为自己的帖子没有任何问题,并不出意外的被公司解雇。Kraker依旧发挥了他的硬气,指控xAI拖欠工资,违反加州劳动法,并举报至相关监管机构。马斯克在X上也关注到了这件事情并且称这很奇怪,当然,具体奇怪的点在哪里我们就不得而知了。

马斯克带着 Grok 3高调入场,看似风光无限,但是从数据问题、算力成本、闭源策略到未来竞争和内部管理等各个方面来看,xAI面临的问题都不小。这些问题若得不到妥善解决,Grok 3 别说成为 “地球上最聪明的 AI”,就连在竞争激烈的 AI 市场站稳脚跟都可能困难重重。

马斯克的入局,或许真的没那么聪明。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值