[论文笔记]REACT: SYNERGIZING REASONING AND ACTING IN LANGUAGE MODELS

愤怒的可乐

已于 2024-12-12 21:58:58 修改

阅读量1.6k

点赞数 14

分类专栏： # 大模型[论文] 自然语言处理论文翻译/笔记文章标签：论文阅读语言模型 ReACT

于 2024-05-21 20:56:31 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yjw123456/article/details/139102046

版权

论文翻译/笔记同时被 3 个专栏收录

78 篇文章 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

自然语言处理

144 篇文章

订阅专栏

大模型[论文]

41 篇文章

订阅专栏

引言

今天带来一篇经典论文REACT: SYNERGIZING REASONING AND ACTING IN LANGUAGE MODELS的阅读笔记，论文中文意思是在语言模型中协同推理和行动。

虽然大型语言模型(LLMs)在语言理解和互动决策任务中展现出强大的能力，但它们在推理(例如思维链提示)和行动(例如行动计划生成)方面的能力主要被研究为独立的主题。在本篇工作中，作者探讨了使用LLMs以交错方式生成推理轨迹和任务特定行动的方法，从而在两者之间实现更大的协同作用：推理轨迹帮助模型归纳、跟踪和更新行动计划，并处理异常情况，而行动则使其能够与外部源(如知识库或环境)进行接口交互并收集额外信息。

作者将该方法命名为ReAct。

1 总体介绍

人类智能的一个独特特征是能够将面向任务的行动与语言推理无缝结合，据理论推测，这在人类认知中发挥着重要作用，能够实现自我调节或策略化并维持工作记忆。以在厨房里烹饪一道菜为例。在任何两个具体行动之间，我们可能会用语言进行推理，以跟踪进展(“现在所有东西都切好了，我应该把锅里的水烧热”)，处理异常情况或根据情况调整计划(“我没有盐，所以我用酱油和胡椒代替”)，以及意识到需要外部信息时(“我该如何准备面团？让我在互联网上搜索一下”)

了解本专栏

超级会员免费看

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

愤怒的可乐 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。