bGPT 开源项目使用教程
1. 项目目录结构及介绍
bgpt/
├── LICENSE
├── README.md
├── config.py
├── cpu-simulation.py
├── inference.py
├── requirements.txt
├── train-cls.py
├── train-gen.py
└── utils.py
目录结构说明
- LICENSE: 项目许可证文件。
- README.md: 项目介绍和使用说明。
- config.py: 项目配置文件,包含训练和推理的配置参数。
- cpu-simulation.py: 用于模拟CPU状态和操作的脚本。
- inference.py: 用于执行推理任务的脚本。
- requirements.txt: 项目依赖库列表。
- train-cls.py: 用于训练分类模型的脚本。
- train-gen.py: 用于训练生成模型的脚本。
- utils.py: 包含支持模型操作和数据处理的实用函数。
2. 项目的启动文件介绍
train-gen.py
train-gen.py
是用于训练生成模型的启动文件。它使用 config.py
中的配置参数来训练模型,并生成新的数据。
使用方法
python train-gen.py
train-cls.py
train-cls.py
是用于训练分类模型的启动文件。它使用 config.py
中的配置参数来训练模型,并对输入数据进行分类。
使用方法
python train-cls.py
inference.py
inference.py
是用于执行推理任务的启动文件。它使用训练好的模型对新数据进行推理,生成或转换数据。
使用方法
python inference.py
3. 项目的配置文件介绍
config.py
config.py
是项目的配置文件,包含训练和推理的配置参数。以下是一些关键配置项的介绍:
训练配置
- TRAIN_FOLDERS: 指定训练数据集的文件夹路径。
- EVAL_FOLDERS: 指定评估数据集的文件夹路径。
- PRETRAINED_PATH: 预训练模型的路径。
- WEIGHTS_PATH: 训练好的模型权重保存路径。
- LOGS_PATH: 训练日志保存路径。
- NUM_EPOCHS: 训练轮数。
- LEARNING_RATE: 学习率。
- BATCH_SIZE: 批处理大小。
推理配置
- INFERENCE_WEIGHTS_PATH: 推理使用的模型权重路径。
- INFERENCE_MODE: 推理模式,可以是
convert
或generate
。 - NUM_SAMPLES: 生成的样本数量。
- TOP_K: 采样策略中的
top_k
参数。 - TOP_P: 采样策略中的
top_p
参数。 - TEMPERATURE: 采样策略中的温度参数。
通过修改 config.py
中的配置参数,可以自定义训练和推理的行为。