记录学习xtuner过程中的收获。
1、环境配置是最容易踩的坑,务必选择cuda12.2的镜像,否则会出现奇怪的错误。
2、大部分的任务可以共用虚拟环境,这样能够减少配置环境的时间。(每次配置要30分钟左右,很打击积极性)。
3、教程写的很详细,严格遵循的话没有问题。
测试时发现模型会生成无意义的语句,甚至难以停机。见图:
以下是复现的结果。
用 xtuner train 命令,微调个人小助手,训练速度较快,约10分钟完成。
训练结果:
随后用xtuner convert 命令进行格式转换(pth->hf),获得学习到的adapter 参数。
用xtuner convert merge 命令合并预训练模型以及adapter模型,获得最终模型。
然后运行streamlit_demo
这个也要耐心等待几分钟,就可以在本地浏览器中打开http://localhost:8501/
体验微调后的模型。
这里模型出现严重的过拟合现象。