书生·浦语大模型实战营-第四课实战

本文讲述了作者在Windows11环境下部署和微调模型时遇到的挑战,如DeepSpeed安装问题、bitsandbytes对Windows支持不足以及基础环境配置的繁琐。作者强调了在Windows上的工作不如Linux环境顺利,并提供了相关安装教程的链接。
摘要由CSDN通过智能技术生成

参考了官方的视频和教程,在本地windows部署,微调功能的使用相对比较容易上手,不深入研究的话,大体的步骤比较简单,官方文档写的非常清楚,请参考官方Xtuner实战,在此不赘述。

本次实战数据集采用的是书生万卷1.0中的法律部分的数据集,配置采用的是internlm2_chat_7b_qlora_lawyer_e3,基础模型使用的是internlm2_chat_7b。

一、增量训练

由于本地环境是win11,在优化环节使用了bitsandbytes,而bitsandbytes默认支持Linux,对windows的支持不够友好,捣腾bitsandbytes花了近5个小时。在train跑起来那一刻眼泪都流出来了。心心念的微调终于开始跑起来了。

1、加DeepSpeed的重要性

windows11下deepspeed安装总有问题,就没有使用deepspeed,结果跑了30多个小时。

2、开源对windows不友好

在Windows环境下,基础库DeepSpeed和bitsandbytes都需要手动安装,里面有很多坑,需要花很多时间去捯饬基础环境,建议用Linux,能避免很多不必要的麻烦。

bitsandbytes安装参考:关于windows上运行bitsandbytes老是报错的(说cuda版本有问题)解决方案_the installed version of bitsandbytes was compiled-CSDN博客

DeepSpeed安装参考:Windows安装DeepSpeed_deepspeed能不能在windows-CSDN博客

在此,感谢以上两位博主的无私奉献。

二、模型测试

1、合并前

2、合并后

  • 7
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值