LLM：模型微调经验

最新推荐文章于 2024-08-09 17:41:52 发布

灵海之森

最新推荐文章于 2024-08-09 17:41:52 发布

阅读量584

点赞数 2

分类专栏： LLM 文章标签：深度学习人工智能机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43814415/article/details/140849843

版权

LLM 专栏收录该内容

38 篇文章 1 订阅

订阅专栏

微调大模型的经验总结

1. 数据集与样本质量

样本数量:
- 一般1万左右的高质量样本即可达到良好效果。
- 对于简单任务，100-300条数据足够；中等难度任务需1000条以上；高难度任务需3000条甚至更多，可能达到10万条。
样本质量:
- 样本质量优先于数量，高质量样本更有效。需要重点关注样本的多样性和答案质量。
继续预训练:
- 当领域任务数据与预训练数据集差异较大时（如内部数据），需进行继续预训练，尤其是数据量较大时。

2. 超参数设置

学习率:
- 推荐范围：pre-train学习率的0.1倍左右。如pre-train为9e-5，则SFT设为9e-6。
- 调整策略：若loss不收敛或震荡大则调低，若下降慢则调高。
warmup_ratio:
- 推荐范围：0.005-0.015。
- 调整策略：学习率大时可增大warmup_ratio。
Epoch数:
- 推荐范围：2-10个epoch。
- 若样本量少，可增加epoch数避免欠拟合；若样本量大，一般2个epoch即可。

3. 其他技巧

全参数SFT+LoRA结合:
- 前10%-30% step使用全参数SFT，后续step使用LoRA，既稳定又节省资源。
自动化测试与反馈:
- 建立基线，使用自动化工具如G-Eval进行测试，及时发现问题并改进。

自己的经验

数据集划分为6:3:1，使用LSH过滤掉重复数据，要确保数据的多样性和高质量。
全量比lora要好，lora初始学习率为1e-4，观察训练loss，不下降就增大学习率，验证集loss飞起就减少学习率。
warmup_ratio 可以0.1或者0.01,不影响最终收敛。

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

灵海之森 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。