OpenAssistant LLaMa 30B SFT 6 模型安装与使用教程

最新推荐文章于 2025-05-06 22:49:38 发布

皮菱晶Jed

最新推荐文章于 2025-05-06 22:49:38 发布

阅读量637

点赞数 17

本文链接：https://blog.csdn.net/gitblog_02910/article/details/144422834

版权

OpenAssistant LLaMa 30B SFT 6 模型安装与使用教程

oasst-sft-6-llama-30b-xor 项目地址: https://gitcode.com/hf_mirrors/ai-gitcode/oasst-sft-6-llama-30b-xor

引言

OpenAssistant LLaMa 30B SFT 6 是基于 Meta AI 的 LLaMA 模型进行训练得到的，它是一个大型语言模型，拥有 30B 个参数，能够进行自然语言处理任务，例如文本生成、问答、文本摘要等。本文将介绍如何安装和使用 OpenAssistant LLaMa 30B SFT 6 模型，并展示一些简单的示例。

安装前准备

系统和硬件要求

操作系统：Linux (推荐 Ubuntu)
硬件：GPU (推荐 NVIDIA)
Python 版本：3.10

必备软件和依赖项

Python 3.10
pip
Git
Transformers 库
PyTorch
sentencepiece
protobuf

安装步骤

创建 Python 虚拟环境

首先，需要创建一个 Python 3.10 的虚拟环境，并激活它：
```
python3.10 -m venv xor_venv
source xor_venv/bin/activate
```

克隆 Transformers 库

接下来，克隆 Transformers 库并切换到测试版本：

git clone https://github.com/huggingface/transformers.git
cd transformers
git checkout d04ec99bec8a0b432fc03ed60cea9a1a20ebaf3c
pip install .

安装依赖项

然后，安装以下依赖项的指定版本：

pip install torch==1.13.1 accelerate==0.18.0 sentencepiece==0.1.98 protobuf==3.20.1

获取 LLaMA 模型权重

由于 Meta AI 对 LLaMA 模型的许可证限制，无法直接提供基于 LLaMA 的模型。因此，需要先获取 LLaMA 模型的原始权重，并将其添加到 llama 子目录中。如果无法获取 LLaMA 模型的原始权重，可以使用以下模型作为基础进行 XOR 转换：
```
https://huggingface.co/elinas/llama-30b-hf-transformers-4.29
```

验证 LLaMA 模型权重

确保 LLaMA 30B 检查点的 md5sum 与以下值匹配：

f856e9d99c30855d6ead4d00cc3a5573  consolidated.00.pth
d9dbfbea61309dc1e087f5081e98331a  consolidated.01.pth
2b2bed47912ceb828c0a37aac4b99073  consolidated.02.pth
ea0405cdb5bc638fee12de614f729ebc  consolidated.03.pth
4babdbd05b8923226a9e9622492054b6  params.json

转换 LLaMA 模型权重

在 Transformers 库的根目录下，运行以下命令进行 LLaMA 模型权重的转换：

python src/transformers/models/llama/convert_llama_weights_to_hf.py --input_dir <input_path_llama_base>  --output_dir <output_path_llama30b_hf> --model_size 30B

验证转换后的权重

在转换目标的目录下，运行以下命令进行 md5sum 校验：

find . -type f -exec md5sum "{}" +

确保转换后的权重的 md5sum 与以下值匹配：

462a2d07f65776f27c0facfa2affb9f9  ./pytorch_model-00007-of-00007.bin
e1dc8c48a65279fb1fbccff14562e6a3  ./pytorch_model-00003-of-00007.bin
9cffb1aeba11b16da84b56abb773d099  ./pytorch_model-00001-of-00007.bin
aee09e21813368c49baaece120125ae3  ./generation_config.json
92754d6c6f291819ffc3dfcaf470f541  ./pytorch_model-00005-of-00007.bin
3eddc6fc02c0172d38727e

oasst-sft-6-llama-30b-xor 项目地址: https://gitcode.com/hf_mirrors/ai-gitcode/oasst-sft-6-llama-30b-xor

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考