alpaca-lora微调

dzysunshine

已于 2023-09-04 12:13:49 修改

阅读量842

点赞数

分类专栏： ChatGPT 文章标签： chatgpt alpaca lora

于 2023-05-25 18:42:10 首次发布

本文链接：https://blog.csdn.net/dzysunshine/article/details/130871404

版权

ChatGPT 专栏收录该内容

18 篇文章

订阅专栏

alpaca-lora项目地址：https://github.com/tloen/alpaca-lora

微调

1、将项目下载到本地

git clone https://github.com/tloen/alpaca-lora.git

模型地址：
https://huggingface.co/decapoda-research/llama-7b-hf

2、配置环境

安装所需的包

pip install -r requirements.txt

预训练模型：decapoda-research/llama-7b-hf 会自动下载。共计33个405M的bin文件，大约占用约14G内存。
在这里插入图片描述
微调数据：https://huggingface.co/datasets/yahma/alpaca-cleaned
该数据基于斯坦福alpca数据进行了清洗。

由于微调时间较长，这里直接后台运行。

nohup python -u finetune.py \
    --base_model '/data/sim_chatgpt/llama-7b-hf' \
    --data_path '/data/datasets/alpaca-cleaned' \
    --output_dir './lora-alpaca' \
    >> log.out 2>&1 &

需要注意的是，运行代码后会报错：在这里插入图片描述

解决方法：在finetune.py中增加一行代码：

with torch.autocast("cuda"):
    trainer.train(resume_from_checkpoint=resume_from_checkpoint)

微调过程预计需要60个小时，占用显存约9个G。
在这里插入图片描述

推理

设置generate.py文件，将share=True，便于公网访问。

python generate.py \
    --load_8bit \
    --base_model '/data/sim_chatgpt/llama-7b-hf' \
    --lora_weights './lora-alpaca/checkpoint-1000'

如果报错，不能创建链接，降低下gradio版本即可，如：pip install gradio==3.13

效果如下，显存占用约8个G（生成速度较慢，大概需要1分钟左右）
在这里插入图片描述

在这里插入图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

dzysunshine

关注关注

0
点赞
踩
10

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

学习实践-Alpaca-Lora (羊驼-Lora)（部署+运行+微调-训练自己的数据集）

LZL2020LZL的博客

04-14

1万+

三月中旬，斯坦福发布的 Alpaca （指令跟随语言模型）火了。其被认为是 ChatGPT 轻量级的开源版本，其训练数据集来源于text-davinci-003，并由 Meta 的 LLaMA 7B 微调得来的全新模型，性能约等于 GPT-3.5。斯坦福研究者对 GPT-3.5（text-davinci-003）和 Alpaca 7B 进行了比较，发现这两个模型的性能非常相似。Alpaca 在与 GPT-3.5 的比较中，获胜次数为 90 对 89。

开源模型应用落地-qwen2-7b-instruct-LoRA微调-Axolotl-单机多卡-RTX 4090双卡（七）

最新发布

Python单行客的博客

03-19

1636

为复杂任务配置多 GPU 环境并自定义依赖。从头构建自定义数据集并支持多模态数据。除了 Unsloth，还有许多工具适用于大型语言模型的微调。以下是几个主流工具的介绍及其特点。Unsloth：适合单 GPU 快速实验，易用性高，推荐初学者和资源有限时使用。DeepSpeed：适合多 GPU 大规模训练，适用于工业级任务。Megatron-LM：专注于超大规模模型，适合研究人员。FairScale：PyTorch 扩展，适合分布式训练场景。

基于LoRA进行Stable Diffusion的微调

dzysunshine的博客

07-25

6882

微调时只需要使用以下命令运行 train_text_to_image_lora.py 文件即可。需要根据下载的路径文件地址对相应的参数进行修改，如。样本数据量为883，这里设置了train_batch_size为2，max_train_steps为7500，数据集一共883条样本，包含两个部分：image（图）和 text（文），如下图所示。也可以根据GPU资源调整相应的参数，如。显存占用约11个G，训练时长约8个小时左右。使用git clone命令下载数据集。

LLaMA模型微调版本：斯坦福 Alpaca 详解

Gefangenes的博客

07-09

695

性能上作者对Alpaca进行了评估，与openai的text-davinct-003模型在self-instruct[2]场景下的性能表现相似。Alpaca 是 LLaMA-7B 的微调版本，使用Self-instruct[2]方式借用text-davinct-003构建了52K的数据，同时在其构建策略上做了一些修改。最终的结果是以少于$500的便宜价格获得了52K的数据，下图反映了其数据多样性，内圈是词根是动词的指令，外圈是表示目标的指令。详细的Self-instruct可以看我别的文章。

足够惊艳，使用Alpaca-Lora基于LLaMA(7B)二十分钟完成微调，效果比肩斯坦福羊驼

吃果冻不吐果冻皮

04-10

6603

从上面可以看到，在一台8卡的A800服务器上面，基于Alpaca-Lora针对指令数据大概20分钟左右即可完成参数高效微调，相对于斯坦福羊驼训练速度显著提升。参考文档LLaMA：斯坦福-羊驼。

【大模型】大模型指令微调的“Prompt”模板_大模型微调数据集格式

2401_85373691的博客

09-27

1694

通过学习大模型课程，可以掌握设计和实现基于大模型的应用系统所需的基本原理和技术，从而提升自己在数据处理、分析和决策制定方面的能力。此外，大模型技术在多个行业中的应用日益增加，掌握这一技术将有助于提高就业竞争力，并为未来的创新创业提供坚实的基础。ShareGPT本身是一个与ChatGPT（GPT-4）模型的聊天记录分享平台，它托管了大量由用户挑选的对话数据集，这些聊天记录通常展示的是聊天机器人自然流畅、具有创意的回答。此外还有中文翻译版本。不同的模型对应不同的微调数据集，不同数据集的指令数据形式有所不同。

Llama-1｜Alpaca-LoRA 微调模型下载以及安装推理教程

u010291330的博客

08-30

1026

以后所有开源语言模型的安装部署，本站都会通过为大家讲解，所以非常推荐大家学习、安装并部署该项目。LLaMA语言模型。

Alpaca-LoRA: 低等级 LLAMA 指令调整

03-19

该存储库包含企业使用低秩适应（LoRA）重现Stanford Alpaca结果的代码。我们提供了一个类似的质量指令模型，可以在 Raspberry Pi 上运行(用于研究) ，并且代码可以很容易地扩展到，和模型。text-davinci-00313b30...

开源模型应用落地-qwen2-7b-instruct-LoRA微调-Axolotl-单机单卡-V100（九）

没有卑微的工作，只有卑微的心态，与其抱怨，不如埋头实干

08-22

7511

使用Axolotl高效微调qwen2-7b-instruct

19个大模型常用的评估数据集和训练数据集汇总

大模型天花板

02-21

1万+

19个大模型常用的评估数据集和训练数据集汇总名称简介测试（数据量）训练（数据量）地址 CEval 中文选择题测试，包括中学、高中、大学的多个学科 √，13948 × https://huggingface.co/datasets/ceval/ceval-exam GSM8K 小学数学题目，通过最后的数字检测正确与否 √，1320 √，8790 h

番外03.SELF-INSTRUCT+Alpaca

老毛的博客

06-21

1444

首发公众号：学姐带你学AI本课程来自深度之眼《大模型——前沿论文带读训练营》公开课，部分截图来自课程视频。自指导：将语言模型与自生成的指令相结合作者：Yizhong Wang等单位：华盛顿大学发表时间：ACL 2023以上介绍的prompt称之为：指令。各种研究表明：对大模型进行指令微调，可使的模型对于新任务具有0-shot的卓越能力（摘要第一句）。但指令微调很大程度上依赖于人类（专家）编写的指令数据，这些些数据在数量、多样性和创造性方面都是有限的，阻碍了调整后的模型的通用性。

【大模型】大模型指令微调的“Prompt”模板

酒酿小圆子呀～

08-07

4772

Alpaca-52k是一个开源的遵循指令的，最初用来微调LLaMA模型以得到Alpaca-7B模型的数据集，包含了52k条指令数据。另外，还有一些针对特定用途的数据集，例如文本总结数据集以及根据纯文本生成对话的数据集，如RefGPT文章提到的方案。ShareGPT本身是一个与ChatGPT（GPT-4）模型的聊天记录分享平台，它托管了大量由用户挑选的对话数据集，这些聊天记录通常展示的是聊天机器人自然流畅、具有创意的回答。不同的模型对应不同的微调数据集，不同数据集的指令数据形式有所不同。

Chinese-LLaMA-Alpaca代码实战

dzysunshine的博客

05-25

4511

将alpaca-combined下的文件都放到7B目录下后，执行下面的操作。工具为例，介绍无需合并模型即可进行本地化部署的详细步骤。使用text-generation-webui搭建界面。我们进一步将FP16模型转换为4-bit量化模型。将合并后的模型权重下载到本地，然后传到服务器上。会显示：7B tokenizer.model。会生成ggml-model-f16.bin。1、先新建一个conda环境。实验效果：生成的中文较短。

大模型_alpaca-lora微调及推理部署

weixin_42504788的博客

04-27

1524

大模型_alpaca-lora微调及推理部署

【LLM系列】00：斯坦福 Alpaca 模型介绍及其复现

ljp1919的专栏

04-21

3795

Stanford Alpaca是一个Instruction-following的LLaMA模型，即一个对LLaMA模型进行指令调优的结果模型。更多细节可以参考。

大模型微调踩坑记录 - 基于Alpaca-LLaMa+Lora

anycall201的博客

04-11

1万+

大模型微调训练时，遇到icetk、bitsandbytes报错的解决方案

NLP大模型微调答疑

狮子座明仔知识集散场

05-17

1万+

我理解ChatGLM-6B模型是走完 “预训练-SFT-RLHF” 过程训练后的模型，其SFT阶段已经有上千指令微调任务训练过，现在我们只是新增了一类指令数据，相对大模型而已，微调数据量少和微调任务类型单一，不会对其原有的能力造成大的影响，所以我认为是不会导致灾难性遗忘问题，我自己微调模型也没出现此问题。ChatGLM-6B, LLaMA-7B模型分别是60亿参数量和70亿参数量的大模型，基本可以处理所有NLP任务，效果好，但大模型部署成本高，需要大显存的GPU，并且预测速度慢，V100都需要1秒一条。