超详细LLama2+Lora微调实战

人工智能大模型讲师培训咨询叶梓

已于 2024-11-03 21:59:28 修改

阅读量2.2w

点赞数 32

文章标签：人工智能 AI讲师大模型大模型讲师

于 2024-04-17 13:37:13 首次发布

原文链接：https://mp.weixin.qq.com/s/KJTkatOrf9TqSrtBPZbKwA

版权

本文介绍了如何使用原始LLama模型通过Lora方法进行微调，包括环境准备、模型转换、微调过程、遇到的问题及解决方案，展示了从头开始微调的完整流程和初步效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

趁热打铁，上一篇总结了高效微调PEFT的主要方法，这一篇实践一下LLama使用Lora进行微调，包含保姆级的详细步骤和各种坑的总结。本文的背景是刚好结合我工作需要微调一下LLama作为翻译工具使用。

想要掌握如何将大模型的力量发挥到极致吗？叶老师带您深入了解 Llama Factory —— 一款革命性的大模型微调工具（限时免费）。

1小时实战课程，您将学习到如何轻松上手并有效利用 Llama Factory 来微调您的模型，以发挥其最大潜力。

CSDN教学平台录播地址：https://edu.csdn.net/course/detail/39987

本文前提需要你知道微调模型的基本原理。

一、方案选择

原始LLama模型+开源Lora代码微调

Huggingface格式LLama模型+Huggingface Lora代码微调

国内已实现的LLama中文微调后的模型进行微调

国内外使用Huggingface模型格式和其配套的通用代码进行微调是主流，且使用方便，这次想从最基本的模型开始，所以选择了方案2，等基本方案摸索清楚后再使用国内大家用中文微调后的模型，比如流行的Chinese-LLaMA-Alpaca-2、Llama2-Chinese等。

二、环境准备

GPU服务器：RTX 3090，24G双GPU，cuda11

Python: 3.11

安装的python包，主要包括：torch 1.19，transformers（huggingface开发），peft（huggingface开发），trl以及其他安装时依赖自动安装的包，基本上就是运行时提示缺啥就装啥，版本不对就改。

三、模型准备

现在大家比较头疼的问题之一是需要科学上网下载国外的模型，否则meta网站访问不了下不了LLama，huggingface从今年9月份开始也访问不了。

LLama模型主要有两种方式下载，都需要提前在meta网站申请一个唯一码，然后使用这个唯一码：一是直接从meta公司网站下载原始格式模型，二是可以从huggingface网站下载huggfaceing格式的模型。具体如何下载网上已经有很多资料，不再赘述。

我之前已经下载了原始格式的模型llama-2-7b，即70亿参数的模型版本，刚好想试试从原始格式一步一步操作，微调使用huggingface的代码，所以执行路径是：原始格式LLama ->转为huggingface格式->使用huggingface代码微调。

原始模型包括文件如下：

四、Huggingface格式模型转换

首先从github克隆下载huggingface的transformers代码，https://github.com/huggingface/transformers，准备好LLama原始模型目录，使用transformers里面的代码执行下面命令：

其中，/tmp/llama-2-7b是原始模型目录，/tmp/llama-2-7b-hf是转换为huggingface格式后要保存的目录。

遇到的坑：原始模型目录结构不对，没转换成功。

解决方法：目录里需要包括tokenizer模型，要么和LLama模型文件放一起，要么把模型文件放在和tokenizer同级的名叫7B的文件夹中，这是转换代码逻辑规定的：

或者

转换完后llama-2-7b-hf中内容如下：

五、小试牛刀

在做微调之前，我们先试试如何使用原始模型进行推理，看看模型的威力，毕竟最终目的都是要使用模型，并且微调前后需要比较模型的输出有什么不一样。

运行原始模型，需要到github克隆下载LLama2代码，其中有两个示例脚本：

第一个是用于对话的例子，第二个是处理文本的，为了方便截图小点，我们以处理文本为例，删掉一部分例子后脚本主要内容如下：

主要就是给两个输入，看看LLama能输出什么内容，就好比在ChatGPT网站输入一些问题，看看能给你输出啥。运行下面命令即可：

输出如下：

模型输出了一些有意思的内容。

六、微调场景和数据准备

本次微调是有实际需求的，我需要一个中英翻译功能API，但是目前商用的翻译API只有少量免费试用词条数，超过条数都是要收费的，那我们就用大模型试试吧。但LLama基座模型绝大多数训练数据都是英文的，对中文效果并不好，所以需要使用中文数据进行微调。

LLama等类似的大模型都是使用无监督学习方法，从句子上一个字预测下一个，所以不需要标签。训练和微调的数据根据你的具体任务构造数据格式就好了，就是大家经常说的提示prompt模板格式。

对于我的翻译任务，我构造的prompt格式如下：

其中，“Translate English to Chinese”是指令要求，Input是输入，Output是输出。我希望在基座模型基础上，使用这个格式的中英和英中数据微调模型，使得微调后的模型在我给“Translate English to Chinese”指令和任意一句英语后，能给我输出中文，或者相反的从中文翻译为英文。

所以我需要从网上找“中-英”对照的数据，整理好后，代码上可以定义一个python list，按照prompt格式加到list中，训练数据样例如下：