理性与回归:OpenAI o1 的探索

🌟

在人工智能(AI)领域,语言模型(LLMs)的发展如同一场激烈的马拉松竞赛:每一个新系统的问世都在与“回归”的影子进行角逐。而如今,OpenAI推出的o1系统,仿佛是一位新晋的“马拉松选手”,在赛道上扬起了新的风帆。本文旨在深入探讨o1的优势与局限,特别是它在优化推理能力的同时,是否仍然保留了“自回归”的特征。

🔍 回归的火花

在《Embers of Autoregression》中,我们首次揭示了多个大型语言模型的局限性,归因于它们源自于“下一个词预测”的训练目标。o1的推出为我们提供了一个新的视角:它是否能够在优化推理的同时,摆脱自回归的束缚?

根据我们的研究,o1在许多任务上的表现显著优于之前的模型,尤其是在处理一些罕见的任务变体(例如,从每个单词的第二个字母形成缩写,而不是第一个字母)。然而,尽管在量化指标上取得了进步,o1在质的特征上仍显示出与之前模型相似的趋势。

📈 概率敏感性:高概率与低概率的较量

我们发现,o1对示例的概率表现出了明显的敏感性。在高概率的任务环境中,它表现得更加出色,所需的“思维令牌”数量也相对较少。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

步子哥

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值