大模型微调十诫：关于将微调模型部署到生产环境的十条建议

人工智能大模型讲师培训咨询叶梓

已于 2024-11-03 21:06:39 修改

阅读量188

点赞数 2

分类专栏：大模型实战文章标签：自然语言处理人工智能深度学习大模型微调调优性能优化

于 2024-10-10 13:04:43 首次发布

原文链接：https://mp.weixin.qq.com/s/a3p6WxpscrPYapUwM4A_AA

版权

大模型实战专栏收录该内容

42 篇文章 1 订阅

订阅专栏

转自NLP工程化

想要掌握如何将大模型的力量发挥到极致吗？叶老师带您深入了解 Llama Factory —— 一款革命性的大模型微调工具（限时免费）。

1小时实战课程，您将学习到如何轻松上手并有效利用 Llama Factory 来微调您的模型，以发挥其最大潜力。

CSDN教学平台录播地址：https://edu.csdn.net/course/detail/39987

大模型微调十诫：关于将微调模型部署到生产环境的十条建议：

（1）不要盲目微调模型，先尝试使用提示的方式满足需求。只有当提示无法达到质量、性能或成本目标时，才考虑微调。

（2）一定要编写提示。通过提示证明任务是可行的，作为微调的基线。如果提示就可以达到要求，微调可以进一步提升；如果提示不起作用，微调成功的可能性就很低。

（3）一定要检查数据质量。删除或修正问题数据。数据质量直接决定模型质量。

（4）使用真实数据进行微调。即使存在一些不完美的数据也没关系，只要整体分布正确就可以。

（5）留出部分数据作为测试集。不要将所有数据都用于训练。

（6）选择合适的模型规模。不要使用过大的模型，也不要使用过小的模型。规模要匹配任务难度。

（7）编写快速的评估指标。可以多次每天评估，以便快速迭代。

（8）同时编写完整的评估。定期进行完整评估，确保快速指标和最终指标一致。

（9）不要执行一次性的模型训练后就结束。持续优化模型和管道。

（10）不要死板地遵循这些建议。根据具体情形调整建议的适用性。

参考文献：

[1] https://docs.google.com/presentation/d/1IIRrTED0w716OsU_-PL5bONL0Pq_7E8alewvcJO1BCE/edit#slide=id.g2721fb6713e_0_44

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。