快速训练自己的大语言模型：基于LLAMA-7B的lora指令微调

猛男炸鸡翅

已于 2023-06-27 13:06:32 修改

阅读量1.5w

点赞数 32

分类专栏： NLP 文章标签： llama lora 指令微调大语言模型

于 2023-06-27 12:58:57 首次发布

本文链接：https://blog.csdn.net/weixin_43508499/article/details/131412735

版权

7 篇文章

订阅专栏

本文详细介绍了在Ubuntu18.04系统上，如何利用lit-llama工程对LLAMA-7B大模型进行指令微调的过程，包括下载工程、安装环境、模型转换、初步测试、数据准备、模型训练和测试。通过指令微调，使模型能更好地理解和回答问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. 选用工程：lit-llama

git clone https://github.com/Lightning-AI/lit-llama.git

cd ./lit-llama

pip install -r requirements.txt

（当然，这里可能会遇到网络问题，安装不了lightning）
可使用以下方式安装：

这里我们要基于LLAMA-7B做指令微调，所以要先下载模型权重，并作一系列转换。

python scripts/download.py --repo_id openlm-research/open_llama_7b --local_dir checkpoints/open-llama/7B

（文件有点大，需要等待一些时间）

还是切换到 lit-llama 所在位置，使用以下指令进行转换

python scripts/convert_hf_checkpoint.py --checkpoint_dir checkpoints/open-llama/7B --model_size 7B

转换完毕之后，在 lit-llama/checkpoints/lit-llama/7B 位置，会得到大小为26G左右的 lit-llama.pth 文件，在上一级目录（lit-llama/checkpoints/lit-llama）还有一个tokenizer.model文件

在命令行，使用如下命令运行：

 python generate.py --prompt "Today is a"

在这里插入图片描述

因为原始的预训练LLAMA模型是一个大语言模型（废话~），会根据前面的单词预测下一个词语，如果你问它问题，它不会正确回答你，你问它一个问题，它可能会续写一些跟你一样的句子，例如，
Prompt为 “What is the capital of China?”，它的回复如下所示：

这里使用alpaca的52k指令数据进行微调，使用如下指令：
```
python scripts/prepare_alpaca.py
```
如果下载不下来的话，我们直接打开scripts/prepare_alpaca.py文件，如下所示：
直接打开链接 https://raw.githubusercontent.com/tloen/alpaca-lora/main/alpaca_data_cleaned_archive.json，然后全选页面复制，再保存到新建的文件里。
得到alpaca_data_cleaned_archive.json（看名字的clean应该是清洗过的），每条指令包含"instruction"、“input”、"output"三个关键字，本次先不具体展开讲解，如下所示：
运行指令后，还会作数据划分，train-49759, val-2000如下所示：
最后，会在lit-llama/data/alpaca路径下得到以下文件：

使用如下指令进行提问，其中prompt为"what is the capital of China?"，
```
python generate/lora.py --prompt "what is the capital of China?"
```
得到的结果如下所示
可以看到，经过指令微调之后，模型已经可以正常回答我们的问题了。