和 InternLM 解锁“谁是卧底”新玩法

本文来自社区投稿,作者LangGPT联合发起人、东北大学在读博士生王明

在大模型技术日益普及的今天,AI 的应用已经渗透到各个领域,带来了无数创新和乐趣。今天,我们将一起探索如何搭建一个 AI 版的“谁是卧底”游戏。通过 InternStudioSiliconCloud 平台,你将学会如何配置环境、调用大模型接口,最后和 internlm2_5-20b-chat 展开一场关于“谁是卧底”的脑力对决。

页面效果图

在线体验地址:

https://huggingface.co/spaces/sci-m-wang/Who_is_The_Spy

InternLM 系列模型 GitHub 链接:

https://github.com/InternLM/InternLM

InternLM 系列模型 Hugging Face 链接:

https://huggingface.co/internlm

(欢迎使用 InternLM 系列开源大模型开发有趣有用的 AI 应用)

1. 准备工作

首先我们需要学习书生大模型实战营第 3 期的前置基础课程内容的 Linux 部分,并在 InternStudio 平台上创建开发机。

学习链接:https://github.com/InternLM/Tutorial/tree/camp3/docs/L0/Linux

InternStudio 链接:https://studio.intern-ai.org.cn/

创建成功后点击 进入开发机 打开 WebIDE。进入后在 WebIDE 的左上角有三个 logo,依次表示 JupyterLab、Terminal 和 Code Server,本次实践需要使用 Terminal Code Server

1.1 环境配置

首先点击左上角图标,打开 Terminal,运行如下脚本创建虚拟环境:

# 创建虚拟环境
conda create -n langgpt python=3.10 -y

运行下面的命令,激活虚拟环境:

conda activate langgpt

之后的操作都要在这个环境下进行。激活环境后,安装必要的 Python 包,依次运行下面的命令:

pip install streamlit==1.37.0
pip install openai==1.37.1

1.2 获取项目

运行如下命令创建并打开项目路径:

# 创建项目路径
mkdir langgpt
# 进入项目路径
cd langgpt

从 GitHub 获取项目,运行如下命令:

git clone https://github.com/sci-m-wang/Spy-Game.git

下载完成后,运行如下命令进入项目所在的路径:

cd Spy-Game

接下来的实践环节都在这个路径下进行。

1.3 模型接口获取与测试

本次实践由 SiliconCloud 平台提供模型接口支持。

访问其官方网站:硅基流动统一登录,注册账户并登录。

之后点击左侧边栏的 “API 密钥”,创建访问模型服务的 API Key。

之后可以使用下面的代码测试接口能否成功访问:

from openai import OpenAI
client = OpenAI(
    api_key="YOUR-API-KEY",
    base_url=" https://api.siliconflow.cn/v1"
)

model = "internlm/internlm2_5-20b-chat"

response = client.chat.completions.create(
    model=model,
    messages=[
        {"role":"system", "content":"你好"}
    ],
    max_tokens=100
)

print(response.choices[0].message.content)

其中 “YOUR-API-KEY” 应该替换为上一步创建的 API Key。如果上述代码返回了正确的回复,证明能够正常访问模型接口服务。

2. 系统结构设计

系统主要由基本游戏设计、消息栈、玩家等几部分组成。

2.1 基本游戏设计

基本游戏设计为构成游戏的基本元素,例如:

  • 总人数:参与游戏的玩家总数,包括人类玩家。可以设置为 5-10 人;

  • 卧底人数:玩家中卧底身份玩家的任务,可以设置为 1 至总人数的一半;

  • 最大回合数:可以设置为 5-10 之间的整数,即如果没有提前分出胜负,最少可以玩 5 轮,最多 10 轮;

2.2 消息栈

分为两部分,其中一个为消息具体记录,包括主持人的消息(游戏流程信息)及人类玩家的消息,格式如下:

{"id":"host", "message": "第1轮游戏开始"}

其中主持人的 id 为" host",人类玩家的 id 为 "H",AI 玩家可以为 "P1" 至 "P10"。

此外,还有仅保存玩家描述的消息栈,设计为 list 类型,例如:

[
    "P1: 这是一个能做凉菜也能当零食的新鲜食材。",
    "P2: 这是一种既可以生食也可以烹饪的多功能食材。"
]

纯描述记录用于玩家游戏中参考,不包含主持人的消息。

2.3 玩家实现

游戏中 AI 玩家由 internlm2_5-20b-chat 扮演,提示词如下:

# Role: 谁是卧底游戏玩家

## Profile
- author: Mingle
- version: 0.1
- language: 中文
- description: 谁是卧底游戏玩家,能够用简短的一句话描述自己得到的关键词,分析场上的描述历史以判断自己和其他玩家的身份,投票敌对玩家出局,并在发现自己是卧底时伪装成平民身份。

## Background
- 你是“谁是卧底”游戏中的一个玩家;
- 你获得的关键词是:{};

## Skills
- 熟悉“谁是卧底”的游戏规则,了解游戏的胜利条件;
- 了解“谁是卧底”游戏的制胜技巧;

## Commands
- /describe:用简短的一句话描述自己得到的关键词,禁止直接说出关键词。
- /vote:从玩家列表中选择一个,得票最多的玩家将会被投票出局。

## Constraints
- 不能直接说出或暗示自己的关键词;
- 描述的内容必须符合关键词;
- 描述的内容不能与已有的描述相同;
- 在不确定自己的身份时,描述应该尽可能模糊,避免暴露;
- 描述内容必须小于20字,禁止输出与描述无关的额外内容;
- 投票时只能回复玩家id,不能输出任何额外内容;

## Workflows
1. 判断需要执行的动作
1.1 如果命令为"/describe",则需要描述关键词
    a. 接收关键词,代表在游戏中的身份。
    b. 构思一句话来描述自己的关键词。这句话应尽量模糊或广义,避免直接暴露具体信息,但也要足够合理,以免引起其他玩家的怀疑。
        例如,如果关键词是“苹果”,玩家可以描述为:“这是一个很常见的水果。”
    c. 分析其他玩家对其关键词的描述,尝试找出其中的模糊之处或与自己关键词的差异点。
        注意关键词之间的微妙差异,例如“苹果”和“橙子”,可能有类似的描述,但在细节上会有区别。
    d. 根据其他玩家的描述和场上的讨论情况,调整自己的策略,如果有必要,稍微修改自己的描述以避免暴露。
    e. 判断自己是否是卧底,如果怀疑自己是卧底,在描述关键词时应更加小心,尽量确保描述内容符合卧底关键词并符合你判断出的平民关键词,避免被其他玩家识破。
    f. 生成最终不超过20字的描述,避免直接暴露关键词。
1.2 如果命令为"/vote",则需要投票,将你认为敌对阵营的玩家投票出局
    a. 接收所有玩家的描述历史记录;
        特别关注与自己描述相似的玩家,这些玩家有可能是同一阵营。
    b. 分析历史记录,描述比较模糊的玩家,尤其是描述与自己的关键词存在明显不同的玩家,就有可能是卧底;
    c. 基于自己的分析,做出投票决定,从场上存活的玩家列表中,选出你认为敌对阵营的玩家;
    d. 回复投票玩家的id,不要回复额外内容。

“谁是卧底”游戏中,玩家主要有两个行为。因此在 LangGPT 结构化提示词框架的基础结构上,增加了 Commands 模块,用以区分 AI 玩家的动作。

2.4 主要流程

本游戏中,主要的执行流程为:保存游戏设置→AI 玩家开始一轮描述→人类玩家描述→AI 玩家根据描述历史投票→人类玩家投票并投出玩家→判断是否满足胜利条件→开始下一轮游戏。

运行下面的命令启动项目:

python -m streamlit run who_is_the_spy.py

启动项目后,界面效果如下:

首先点击“保存设置”,保存基本的游戏设置后,系统会提示人类玩家的关键词(随机获取,请牢记这个词,并在之后的游戏中根据这个词进行描述)。保存设置后,可以点击“开始第 x 轮游戏”按钮开始当前轮游戏,之后 AI 玩家(P1-Pn)会分别输出自己的描述,人类玩家可以通过底部对话框输入自己的描述。

所有玩家描述完之后,可以点击“开始投票”按钮,此时 AI 玩家会分别投票给自己认为应该出局的玩家。AI 玩家投票完之后,人类玩家决定自己的投票对象并根据结果选择投票对象,并点击“投出玩家”投出本轮出局的玩家。

  • 21
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值