Grok 3模型震撼发布抢先免费体验

最新推荐文章于 2025-03-03 10:08:26 发布

细节处有神明

最新推荐文章于 2025-03-03 10:08:26 发布

阅读量522

点赞数 4

分类专栏：工具推荐 deepseek chatgpt 文章标签：人工智能 aigc grok ai

本文链接：https://blog.csdn.net/weixin_42984235/article/details/145706529

版权

工具推荐同时被 3 个专栏收录

18 篇文章

订阅专栏

deepseek

18 篇文章

订阅专栏

chatgpt

14 篇文章

订阅专栏

北京时间 2 月 18 日中午 12 点，马斯克旗下 xAI 公司正式发布了备受瞩目的新一代人工智能模型——Grok 3。这款被誉为“地表最强 AI”的智能巨头，不仅在性能上实现了质的飞跃，更在多个领域展现出强大的应用潜力。我将带您深入了解 Grok 3 的核心优势与亮点，并快速尝鲜 Grok 3

Grok 3 的亮点

上图展示的是 Chatbot Arena (LMSYS) 平台上不同大型语言模型 (LLM) 的 Elo 评分，反映了它们在用户体验和性能方面的相对排名。图表中，Grok-3 的早期版本 "chocolate" 以 1400+ 的高分位居榜首，显示出其强大的实力和潜力。

上图展示了不同大型语言模型（LLM）在数学、科学和编程三个基准测试中的得分情况。其中，Grok-3 在所有三个测试中都取得了最高分，超过了 deepseek v 3、gemini、Claude、GPT 4 O。

上图展示了不同大型语言模型在 AIME 2025 数学竞赛中的表现，主要考察它们的推理能力和计算能力。其中，Grok-3 Reasoning Beta 版本以 93 分的最高分遥遥领先，Grok-3 mini Reasoning 版本也达到了 90 分，显示出 Grok 系列模型在数学推理方面的强大实力。相比之下，Deepseek-R 1 和 Gemini-2 Flash Thinking 的得分分别为 87 分和 79 分，表明它们在解决复杂数学问题方面与 Grok 系列模型存在差距。03 mini (high) 和 01 模型的得分则分别为 87 分和 75 分。整体来看，Grok-3 系列模型在 AIME 2025 测试中表现突出，尤其 Grok-3 Reasoning Beta 版本在数学推理能力上展现出显著优势。