LARGE LANGUAGE MODEL AS AUTONOMOUS DECISION MAKER

最新推荐文章于 2024-09-26 17:23:00 发布

UnknownBody

最新推荐文章于 2024-09-26 17:23:00 发布

阅读量1.6k

点赞数

文章标签：人工智能语言模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/c_cpp_csharp/article/details/132581087

版权

LLM 日更专栏收录该内容

516 篇文章 3 订阅

已下架不支持订阅

本文提出JUDEC方法，让大型语言模型（LLM）具备自我判断能力，进行自主决策探索。JUDEC使用Elo分数评估决策步骤，提高解决方案质量和效率，实验显示在ToolBench数据集上通过率提升超过10%，减少了API调用成本。

摘要由CSDN通过智能技术生成

本文是LLM系列文章，针对《LARGE LANGUAGE MODEL AS AUTONOMOUS DECISION MAKER》的翻译。

作为自主决策者的大语言模型

摘要
1 引言
2 前言
3 任务形式化
4 方法
5 实验
6 相关工作
7 结论

摘要

尽管大型语言模型（LLM）表现出令人印象深刻的语言理解和上下文学习能力，但在解决现实世界任务时，它们的决策能力仍然严重依赖于特定任务专家知识的指导。为了释放LLM作为自主决策者的潜力，本文提出了一种JUDEC赋予LLM自我判断能力的方法，使LLM能够实现自主判断和决策探索。具体来说，在JUDEC中，基于Elo的自我判断机制被设计为将Elo分数分配给决策步骤，通过两个解决方案之间的成对比较来判断其价值和效用，然后相应地引导决策搜索过程走向最优解决方案。ToolBench数据集的实验结果表明，JUDEC优于基线，在不同任务上的通过率提高了10%以上。它提供更高质量的解决方案并降低成本（ChatGPT API调用），突出了其有效性和效率。

1 引言

2 前言

3 任务形式化

4 方法

5 实验

6 相关工作

7 结论

了解本专栏

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

已下架不支持订阅

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

UnknownBody 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。