【项目实训】基于大模型的小学语数英辅助教育平台 | 使用阿里云平台对Qwen模型进行微调

        本节主要是熟悉阿里云PAI平台,导入模型并使用LoRa和前期处理好的数据进行微调

一、阿里云PAI平台

        使用PAI平台中的交互式建模平台DSW进行训练。

        首先创建工作空间,对其名称、可见性、存储空间等进行设置

        

        然后创建DSW实例,对实例名称、计算资源、镜像环境等进行设置,需要注意镜像环境是否满足要求的训练环境

        

二、将模型加载到DSW中

        我们这里选择从魔搭社区下载模型并加载到DSW中,以Qwen-7B-Chat-Int4为例

from modelscope import AutoModelForCausalLM, AutoTokenizer
from modelscope import GenerationConfig

from modelscope import snapshot_download
model_dir = snapshot_download('qwen/Qwen-7B-Chat-Int4',cache_dir='model')

三、使用peft进行LoRa微调模型

         传入预训练模型路径、数据路径、训练函数等进行训练,这里我们使用Qwen-7B-Chat-Int4模型,qlora训练方法和自己前期处理好的数据集进行训练

 训练好的权重文件如下:

        

  • 7
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值