为通信游戏探索LLM：基于狼人杀的实证研究

三谷秋水

于 2024-06-08 16:29:22 发布

阅读量348

点赞数 2

分类专栏：大模型智能体文章标签：游戏语言模型人工智能自然语言处理机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yorkhunter/article/details/139541586

版权

大模型同时被 2 个专栏收录

722 篇文章

订阅专栏

475 篇文章

订阅专栏

23年9月清华和中关村实验室的论文“Exploring Large Language Models for Communication Games: An Empirical Study on Werewolf”。

探讨将大型语言模型（LLM）应用于通信游戏，并提出一个无微调的框架。使LLM保持冻结状态，并依赖于对过去通信和经验的检索和反思来进行改进。对具有代表性且被广泛研究的通信游戏“狼人杀”的实证研究，在不调整LLM参数的情况下有效地玩狼人杀游戏。对于游戏中的每个角色，通过提示实现一个基于LLM的个体智体。

狼人杀游戏概要：共有5个角色和7名玩家，每个角色都由LLM自主扮演。如下图所示：每次说话前的数字表示说话顺序。一些社会行为主要可以在这个图中观察到，包括信任、对抗、伪装和领导。

添加图片注释，不超过 140 字（可选）

如图所示是响应生成的提示概要，由四个部分组成：
（1）游戏规则、指定的角色、每个角色的能力和目标，以及有效游戏策略的一些基本人类先验知识；
（2）最近的K个消息、一组启发式选择的信息化消息和智体的反思，主要挑战是LLM的上下文长度有限；
（3）从过去的经验中提取的建议，不微调模型情况下，从经验中学习；
（4）引发推理的思维链IoT。

添加图片注释，不超过 140 字（可选）

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。