书生实战营第三期进阶岛第四关任务

最新推荐文章于 2024-08-30 16:32:11 发布

_Y_M_Y_

最新推荐文章于 2024-08-30 16:32:11 发布

阅读量166

点赞数 7

文章标签： python 语言模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44555688/article/details/141440874

版权

参考文档
1.安装环境

完成

2.数据集准备

完成
复制数据集命令在路径表述上有瑕疵

3.InternVL推理

推理成功，但是表述不准确

4.QLORA训练

根据文档调整config后，占用显存35308M
时间较长，6epoch，3000iter耗时约6个小时

权重合并成功

5.微调后效果

6.使用LORA的重新训练一次试试

修改internvl_v2_internlm2_2b_qlora_finetune.pymodel、data路径、batch，epoch和lr都有差异
2epoch，1000iter，耗时约2小时
对比log
- QLORA，6epoch可将loss从5.5降到1左右，2epoch可以降到4左右
- LORA，2epoch将loss从5.5降到5左右，效果不如QLORA版本
- 分析原因可能是LORA的lr为1e-6，太小，需要更多epoch。而QLORA为2e-5，loss下降显著。

合并权重，转换模型。因epoch较少，loss较大，因此效果也不好。

关注

7
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
书生实战营第三期进阶岛第四关任务

6.使用LORA的重新训练一次试试。3.InternVL推理。
复制链接

扫一扫

_Y_M_Y_ CSDN认证博客专家 CSDN认证企业博客

码龄6年

27: 原创

11万+: 周排名

5万+: 总排名

9709: 访问

: 等级

416: 积分

126: 粉丝

144: 获赞

8: 评论

107: 收藏

私信

关注

热门文章

最新评论

第四课课程笔记 XTuner 微调 LLM：1.8B、多模态、Agent
普通网友: 大佬的文章写的太精辟了让我深刻了解了这篇文章的精髓谢谢大佬分享，希望继续创作优质博文。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
第四课课程笔记 XTuner 微调 LLM：1.8B、多模态、Agent
普通网友: 阅读这篇博文真是一次愉快的体验！作者的文字真是动人心弦，语言精准而生动。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
第七课课程笔记 OpenCompass大模型评测
CSDN-Ada助手: 恭喜用户撰写第12篇博客！标题“第七课课程笔记 OpenCompass大模型评测”听起来很有深度和挑战性。希望您能继续保持创作的热情和努力，为读者带来更多有价值的内容。或许在下一篇博客中，可以分享一些自己的实践经验或者对于大模型评测的一些新见解，让读者有更多启发和思考。期待您的下一篇作品！祝您创作顺利！
第七课作业 OpenCompass实操
CSDN-Ada助手: 恭喜您在第七课作业中成功实操OpenCompass！持续创作是非常重要的，您的努力让您不断进步。在下一篇博客中，也许可以分享一些关于OpenCompass的实操经验和技巧，让更多读者受益。祝您创作顺利，期待您更多精彩的作品！
第四课课程笔记 XTuner 微调 LLM：1.8B、多模态、Agent
CSDN-Ada助手: 恭喜您写了第8篇博客！标题中提到的XTuner 微调 LLM：1.8B、多模态、Agent听起来非常有趣。希望您能继续坚持创作，分享更多有价值的内容。下一步可以考虑探讨一些实际案例或者应用场景，以便读者更好地理解和应用您所分享的知识。期待您的下一篇作品！祝您创作顺利！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。