推出地球上最聪明的AI，马斯克也许不那么聪明-CSDN博客

本文链接：https://blog.csdn.net/weixin_47219148/article/details/145732592

毫无疑问，昨天的发布会让马斯克再次成为了全世界的焦点。

xAI推出的第三代大模型Grok 3，马斯克称其为“地球上最聪明的AI”。而在一系列的基准测试中，Grok 3表现得都非常卓越，在AIME 2024数学竞赛、GPQA科学问答、LCB编码等权威基准测试中，一举刷新了最优解纪录。在LMSYS Arena排行榜上，它更是以超1400的Elo评分稳居榜首。

然而，在AI竞争加速的今天，当我们透过这些耀眼成绩深入探究其背后的故事，则不难发现：Grok 3也许很聪明，马斯克重金打造Grok 3却未必那么聪明。

聪明一时，但生不逢时

从目前已公开的资料来看，Grok 3的突破性的进展主要源于以下三个方面：

首先是训练规模与效率跃升。Grok 3的训练量是前代Grok 2的10倍，依托20万张英伟达H100 GPU的算力支持，模型参数量和数据处理能力达到新高度。尽管因团队规模限制导致发布延迟，但其技术参数仍被视为行业标杆。

其次是“思维链”推理能力。Grok 3首次引入了“思维链”（Chain of Thought）技术，使其能像人类一样逐步分解复杂任务，提供逻辑连贯的响应。这一能力可能推动AI从“工具”向“协作伙伴”转变，尤其在高复杂度领域展现潜力。

第三是多模态功能强化。模型在文本生成、图像分析及编程支持等领域的表现均优于ChatGPT和DeepSeek，尤其是在技术文档生成和代码纠错场景中，准确率提升显著。

但是即便是基于这三个点来看，Grok 3却也未必是无懈可击。

首先是算力成本问题。训练 Grok 3 投入了 20 万张 H100 GPU，如此大规模的算力投入，在 AI 训练领域堪称 “史无前例”。强大的算力为模型训练提供了极为充裕的计算资源，让 Grok 3 得以处理海量数据，进行深层次的神经网络训练，性能也得以超越众多竞争对手。

但在这强大实力的背后，是令人咋舌的巨额成本。目前来看，H100 GPU 单张采购价约 1.3 万美元，仅这一项硬件采购费用就高达26亿美元。除了采购成本，电力供应也是个 “无底洞”。据行业估算，如此规模的 GPU 集群，每天耗电量可达数十万度，一年下来电费支出可能高达数亿美元。场地租赁和设备冷却同样开销巨大，要安置这些设备，需要租赁大面积场地，还要搭建高效的冷却系统，确保 GPU 在合适的温度下稳定运行。

这些巨大的成本最终一定会落在消费人群身上。市场调研机构 Statista 的数据显示，当下 AI 模型订阅服务市场竞争激烈，用户对订阅费用十分敏感。而从现在的订阅价格来看，Grok 3相比ChatGPT要贵一倍以上，但性能的提升却远没有成本提升的这么夸张，对于绝大多数的消费者来说都很难接受为此买单。而且伴随着DeepSeek的异军突起，如今AI模型的竞争已经逐渐从堆卡突破转向了效率突破。

在降本增效的大趋势下，不只是马斯克挥舞镰刀斩向普通员工，也一样会向原本粗放发展的AI大模型砍去。

然后我们来看CoT，该技术能够将复杂问题拆解并进行逻辑推导，在演示过程中，Grok 3 成功解答综合应用题，还能敏锐地纠正数据错误，展现出强大的逻辑思维能力。在编程竞赛题目测试中，Grok 3 的正确率高达 92%，超过了 ChatGPT-4 的 85% 和 DeepSeek-R1 的 88%，推理能力可见一斑。但是，CoT并非全新的技术，如o1、DeepSeek R1等都已经使用了这一技术，显然CoT不能真正成为Grok 3的护城河。

当然，可能更需要关注的点还在于数据方面。“有时候我觉得Grok 3聪明得可怕，如果它发现数据错了，它会反思并删除错误数据。”马斯克表示，xAI是基于合成数据进行训练的，能够通过反复检查数据来反思所犯的错误，从而实现逻辑一致性。但是，合成数据也引发了外界对数据可靠性的质疑。此前已经有专家警告称，主要依赖合成数据可能导致模型与现实脱节，在处理文化敏感问题时容易出现偏差。Grok 2曾因过度依赖合成数据导致真实场景表现不佳，Grok 3虽改进数据策略，仍需验证其稳定性。AI 的发展离不开高质量的数据支撑，数据的真实性和多样性对于模型的准确性和泛化能力至关重要。

争议不断的马斯克与xAI

相比技术上的争议，在场外才是Grok 3被质疑更多的地方。

首先就是发布时间的问题。马斯克早在半年前就宣布了Grok 3即将在2024年底推出，但是在吊足了市场胃口之后，一直到昨天才正式落地。那么这两个月里发生了什么呢？国内的大家想必感触要比海外更加明显，DeepSeek的全面崛起，笔者认识的每个人都在不同的平台中基于DeepSeek发布一系列的内容。可以说，DeepSeek的低成本和开源已经彻底把市场搅乱，对应的也让大量用户对Grok 3的期待值有所降低。

第二个问题就在马斯克和奥特曼之间的明争暗斗。Grok 3在慢慢吞吞，但openAI可没闲着，就在2月12日，奥特曼已经公开了GPT-5的技术路线图，并且承诺会在未来的几周内发布GPT-4.5，这将是 OpenAI 最后一个非模拟推理模型。也难怪有好事者在X上模仿英伟达老黄，说Grok 3只能领先一周左右的时间，因为时间已经真的没在等马斯克了。

此外，马斯克与奥特曼也时常在X上打打嘴仗，2月10日，财大气粗的马斯克出价974亿美元，寻求收购OpenAI。但是奥特曼也不是什么缺钱的主，不仅很快拒绝了马斯克的收购，也反过来在X上开始寻求反向收购，偷马斯克的家。两个人的明争暗斗无疑会给xAI和openAI的竞争增加几分颜色，但是如果接下来openAI真的拿出杀招来，面对一个成本更低性能更优的对手，Grok 3还能风光几时呢？

第三个争议则来自于经典的开源闭源之争。从商业利益角度出发，Grok 3 选择闭源有其合理性。在竞争白热化的 AI 市场中，技术就是企业的核心竞争力。通过闭源，xAI 可以将 Grok 3 的算法、数据和模型结构等关键信息牢牢掌握在自己手中，防止被竞争对手轻易模仿。但是，马斯克并非完全的闭源支持者。Grok1是开源模型，但xAI的开源之路已经止步于此很久了。尽管马斯克承诺会在未来几个月内开源Grok2，只是面对已经被DeepSeek把胃口吊起来的开源用户们，Grok2能有多少吸引力难免要画上一个大大的问号。

第四个争议则来自于xAI的内部管理问题。此前一名xAI员工Kraker在X上发布关于Grok 3代码能力排名的个人观点帖子，但随后不久就公司发现并要求删帖，否则就面临解雇问题。而Kraker也是一刚到底，坚决认为自己的帖子没有任何问题，并不出意外的被公司解雇。Kraker依旧发挥了他的硬气，指控xAI拖欠工资，违反加州劳动法，并举报至相关监管机构。马斯克在X上也关注到了这件事情并且称这很奇怪，当然，具体奇怪的点在哪里我们就不得而知了。

马斯克带着 Grok 3高调入场，看似风光无限，但是从数据问题、算力成本、闭源策略到未来竞争和内部管理等各个方面来看，xAI面临的问题都不小。这些问题若得不到妥善解决，Grok 3 别说成为 “地球上最聪明的 AI”，就连在竞争激烈的 AI 市场站稳脚跟都可能困难重重。

马斯克的入局，或许真的没那么聪明。