本节主要是熟悉阿里云PAI平台,导入模型并使用LoRa和前期处理好的数据进行微调
一、阿里云PAI平台
使用PAI平台中的交互式建模平台DSW进行训练。
首先创建工作空间,对其名称、可见性、存储空间等进行设置
然后创建DSW实例,对实例名称、计算资源、镜像环境等进行设置,需要注意镜像环境是否满足要求的训练环境
二、将模型加载到DSW中
我们这里选择从魔搭社区下载模型并加载到DSW中,以Qwen-7B-Chat-Int4为例
from modelscope import AutoModelForCausalLM, AutoTokenizer
from modelscope import GenerationConfig
from modelscope import snapshot_download
model_dir = snapshot_download('qwen/Qwen-7B-Chat-Int4',cache_dir='model')
三、使用peft进行LoRa微调模型
传入预训练模型路径、数据路径、训练函数等进行训练,这里我们使用Qwen-7B-Chat-Int4模型,qlora训练方法和自己前期处理好的数据集进行训练
训练好的权重文件如下: