如何用清华 ChatGLM 微调一个私域大模型

最新推荐文章于 2024-07-31 16:10:13 发布

dbLenis

最新推荐文章于 2024-07-31 16:10:13 发布

阅读量727

点赞数 1

文章标签： chatgpt

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wujiandao/article/details/133053217

版权

曹政，曹大是我们圈子里公认的大佬。他在技术上不仅早早领先，在思维认知领域更是帮助很多小伙伴快速成长。

没有 ChatGPT 之前，我一直在想，能否将曹大的思维，直接植入过来，就跟无崖子传输功力，头碰头就行。当然我多想了 !!

ChatGPT 出来后，快速获取通识变得异常高效。但解决问题的思考模型，还是缺少系统性的植入。直到 LLaMa, ChatGLM 开源后，我才发觉，奇点真的可能到了，微调就能达到制作私域内容数字分身的效果。

于是，周末我趁着大块时间，一鼓作气，把微调这个事儿，给办了。用的微调语料当然是曹大的 500+ 篇公众号文章。

以下是我的制作步骤：

下载清华 ChatGLM 2 6B 的大模型
下载 github 清华微调套件
利用 ChatGPT 3.5 制作微调语料

4. 开始训练 GLM 大模型，得到 checkpoint

下面看看效果：

更详细的测评，我上传到了视频号：

微调前

微调后

对于技术感兴趣的同学，我分享个用 ChatGPT 3.5 打标注，组训练数据集的技巧吧。除了人工标注数据外，GPT 在这方面非常有优势。

下面是我用到的 Prompt:

上面微调前后对比图中，用到的微调语料数据集，就是这段 Prompt 生成的。如果用 GPT 4 的话，效果更好，但费用也更高。

下面带个货，Prompt 如此重要的技能，无论工资涨没涨，买书学技能的银子大家肯定舍得花的，不用 79，一半就成，哈哈哈哈哈：

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

dbLenis 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。