书生大模型实战营第三期_Xtuner微调(81班1101作业)

记录学习xtuner过程中的收获。

1、环境配置是最容易踩的坑,务必选择cuda12.2的镜像,否则会出现奇怪的错误。

2、大部分的任务可以共用虚拟环境,这样能够减少配置环境的时间。(每次配置要30分钟左右,很打击积极性)。

3、教程写的很详细,严格遵循的话没有问题。

测试时发现模型会生成无意义的语句,甚至难以停机。见图:

以下是复现的结果。

用 xtuner train 命令,微调个人小助手,训练速度较快,约10分钟完成。

训练结果:

 

随后用xtuner convert 命令进行格式转换(pth->hf),获得学习到的adapter 参数。 

 

用xtuner convert merge 命令合并预训练模型以及adapter模型,获得最终模型。

然后运行streamlit_demo 

 

这个也要耐心等待几分钟,就可以在本地浏览器中打开http://localhost:8501/

体验微调后的模型。

 

这里模型出现严重的过拟合现象。 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值