北京时间 2 月 18 日中午 12 点,马斯克旗下 xAI 公司正式发布了备受瞩目的新一代人工智能模型——Grok 3。这款被誉为“地表最强 AI”的智能巨头,不仅在性能上实现了质的飞跃,更在多个领域展现出强大的应用潜力。我将带您深入了解 Grok 3 的核心优势与亮点,并快速尝鲜 Grok 3
Grok 3 的亮点
上图展示的是 Chatbot Arena (LMSYS) 平台上不同大型语言模型 (LLM) 的 Elo 评分,反映了它们在用户体验和性能方面的相对排名。图表中,Grok-3 的早期版本 "chocolate" 以 1400+ 的高分位居榜首,显示出其强大的实力和潜力。
上图展示了不同大型语言模型(LLM)在数学、科学和编程三个基准测试中的得分情况。其中,Grok-3 在所有三个测试中都取得了最高分,超过了 deepseek v 3、gemini、Claude、GPT 4 O。
上图展示了不同大型语言模型在 AIME 2025 数学竞赛中的表现,主要考察它们的推理能力和计算能力。其中,Grok-3 Reasoning Beta 版本以 93 分的最高分遥遥领先,Grok-3 mini Reasoning 版本也达到了 90 分,显示出 Grok 系列模型在数学推理方面的强大实力。相比之下,Deepseek-R 1 和 Gemini-2 Flash Thinking 的得分分别为 87 分和 79 分,表明它们在解决复杂数学问题方面与 Grok 系列模型存在差距。03 mini (high) 和 01 模型的得分则分别为 87 分和 75 分。整体来看,Grok-3 系列模型在 AIME 2025 测试中表现突出,尤其 Grok-3 Reasoning Beta 版本在数学推理能力上展现出显著优势。
抢先体验 Grok 3
截至成稿期间,Grok 官网仍无法使用 Grok 3,本文推荐一个免费体验 Grok 3 早期版本的网址。
https://lmarena.ai/
进入网站后点击直接对话,选择 Grok 3 即可。
BY
纯个人经验,如有帮助,请收藏点赞。
微信公众号:环境猫 er
CSDN : 细节处有神明
个人博客: https://maoyu92.github.io/