大模型微调十诫:关于将微调模型部署到生产环境的十条建议

转自NLP工程化

想要掌握如何将大模型的力量发挥到极致吗?叶老师带您深入了解 Llama Factory —— 一款革命性的大模型微调工具(限时免费)。

1小时实战课程,您将学习到如何轻松上手并有效利用 Llama Factory 来微调您的模型,以发挥其最大潜力。

CSDN教学平台录播地址:https://edu.csdn.net/course/detail/39987

大模型微调十诫:关于将微调模型部署到生产环境的十条建议:

(1)不要盲目微调模型,先尝试使用提示的方式满足需求。只有当提示无法达到质量、性能或成本目标时,才考虑微调。

(2)一定要编写提示。通过提示证明任务是可行的,作为微调的基线。如果提示就可以达到要求,微调可以进一步提升;如果提示不起作用,微调成功的可能性就很低。

(3)一定要检查数据质量。删除或修正问题数据。数据质量直接决定模型质量。

(4)使用真实数据进行微调。即使存在一些不完美的数据也没关系,只要整体分布正确就可以。

(5)留出部分数据作为测试集。不要将所有数据都用于训练。

(6)选择合适的模型规模。不要使用过大的模型,也不要使用过小的模型。规模要匹配任务难度。

(7)编写快速的评估指标。可以多次每天评估,以便快速迭代。

(8)同时编写完整的评估。定期进行完整评估,确保快速指标和最终指标一致。

(9)不要执行一次性的模型训练后就结束。持续优化模型和管道。

(10)不要死板地遵循这些建议。根据具体情形调整建议的适用性。

图片

参考文献:

[1] https://docs.google.com/presentation/d/1IIRrTED0w716OsU_-PL5bONL0Pq_7E8alewvcJO1BCE/edit#slide=id.g2721fb6713e_0_44

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值