两周前,xAI发布了Grok-1。
今日,xAI推出了Grok-1.5。我们一起来看下。
宣布Grok-1.5
Grok-1.5具备改进的推理能力,上下文长度为128,000个标记。即将在𝕏上推出。
介绍Grok-1.5,我们最新的模型,能够理解长篇上下文并进行高级推理。Grok-1.5将在未来几天内提供给我们的早期测试者和现有的Grok用户,供在𝕏平台上使用。
两周前发布了Grok-1的模型权重和网络架构,我们展示了截至去年11月份为止xAI所取得的进展的一瞥。自那时以来,我们在我们最新的模型Grok-1.5中改进了推理和解决问题的能力。
能力与推理
在Grok-1.5中最显著的改进之一是其在编码和与数学相关的任务中的表现。在我们的测试中,Grok-1.5在MATH基准测试中取得了50.6%的分数,在GSM8K基准测试中取得了90%的分数。这两个数学基准测试涵盖了从小学到高中竞赛题目的广泛范围。此外,它在HumanEval基准测试中得分74.1%,该测试评估了代码生成和问题解决能力。
长篇上下文理解
Grok-1.5的一个新功能是能够在其上下文窗口内处理长达128K标记的长篇上下文。这使得Grok的内存容量增加了前一个上下文长度的16倍,使其能够利用来自 substantially longer documents 的信息。