Unlocking the Future: Exploring Look-Ahead Planning Mechanistic Interpretability in LLM

本文是LLM系列文章,针对《Unlocking the Future: Exploring Look-Ahead Planning Mechanistic Interpretability in Large Language Models》得翻译。

摘要

规划作为智能体的核心模块,在具身智能体、网页导航、工具使用等各个领域都至关重要。随着大型语言模型 (LLM) 的发展,一些研究人员将大型语言模型视为智能代理,以刺激和评估其规划能力。然而,规划机制仍不清楚。在这项工作中,我们专注于从信息流和内部表示的角度探索大型语言模型中的前瞻性规划机制。首先,我们通过分析最后一个标记处的多层感知 (MLP) 和多头自我注意 (MHSA) 组件来研究如何在内部进行规划。我们发现,在最后一个 token 的中间层 MHSA 的输出可以在一定程度上直接解码决策。基于这一发现,我们进一步通过信息流追踪了 MHSA 的来源,并揭示了 MHSA 主要从目标状态和近期步骤的跨度中提取信息。根据信息流,我们继续研究其中编码了哪些信息。具体来说,我们探讨了未来的决策是否已经提前编码在流的表示中。我们证明,当规划成功时,中层和上层在某种程度上编码了一些短期的未来决策。总体而言,我们的研究分析了 LLM 的前瞻性规划机制,促进了未来对 LLM 执行规划任务的研究。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值