ArCHer项目安装与配置指南

皮奕清Primavera

于 2025-04-20 07:01:47 发布

阅读量677

点赞数 10

本文链接：https://blog.csdn.net/gitblog_00128/article/details/147359083

版权

ArCHer是一个用于训练语言模型代理的研究项目，通过分层多轮强化学习（Hierarchical Multi-Turn RL）来实现。该项目旨在通过先进的机器学习技术，提升语言模型在多轮对话中的表现。项目主要使用的编程语言是Python。

在开始安装之前，请确保您的系统中已安装以下依赖项：

克隆项目仓库

打开命令行界面，执行以下命令来克隆项目仓库：
```
git clone https://github.com/YifeiZhou02/ArCHer.git
cd ArCHer
```
创建Python虚拟环境并安装依赖

使用conda创建一个新的虚拟环境并安装所需的Python包：
```
conda create -n archer python==3.10
conda activate archer
python -m pip install -e .
```
如果需要安装spacy，执行以下命令：
```
python -m spacy download en_core_web_sm
```
下载数据集和检查点

根据项目README中的说明，下载所需的数据集和预训练的SFT检查点。
修改配置文件

根据你的需求修改scripts/config/default.yaml文件中的huggingface_token和wandb_key。
运行项目

根据项目配置，运行相应的脚本文件来开始训练或评估模型。例如，运行以下命令来开始一个20Q环境的实验：
```
cd scripts
python run.py --config-name archer_20q
```