书生浦语-模型微调
最新推荐文章于 2024-10-13 10:05:58 发布
本文介绍了大语言模型微调的过程,包括LoRA旁路分支微调和使用Xtuner框架进行训练,特别提到微调作业通常需要16个epoch的训练时间。
摘要由CSDN通过智能技术生成