🌟
在人工智能(AI)领域,语言模型(LLMs)的发展如同一场激烈的马拉松竞赛:每一个新系统的问世都在与“回归”的影子进行角逐。而如今,OpenAI推出的o1系统,仿佛是一位新晋的“马拉松选手”,在赛道上扬起了新的风帆。本文旨在深入探讨o1的优势与局限,特别是它在优化推理能力的同时,是否仍然保留了“自回归”的特征。
🔍 回归的火花
在《Embers of Autoregression》中,我们首次揭示了多个大型语言模型的局限性,归因于它们源自于“下一个词预测”的训练目标。o1的推出为我们提供了一个新的视角:它是否能够在优化推理的同时,摆脱自回归的束缚?
根据我们的研究,o1在许多任务上的表现显著优于之前的模型,尤其是在处理一些罕见的任务变体(例如,从每个单词的第二个字母形成缩写,而不是第一个字母)。然而,尽管在量化指标上取得了进步,o1在质的特征上仍显示出与之前模型相似的趋势。
📈 概率敏感性:高概率与低概率的较量
我们发现,o1对示例的概率表现出了明显的敏感性。在高概率的任务环境中,它表现得更加出色,所需的“思维令牌”数量也相对较少。