ChatGLM2-6B、ChatGLM-6B 模型训练自己数据集实战

最新推荐文章于 2024-06-09 09:05:54 发布

「已注销」

最新推荐文章于 2024-06-09 09:05:54 发布

阅读量1.2k

点赞数

文章标签： java python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2201_75630006/article/details/131631901

版权

本文介绍了ChatGLM-6B和ChatGLM2-6B这两个基于General Language Model的对话模型，包括它们的优点、不足以及区别。ChatGLM2-6B在性能、上下文长度和推理效率上有所提升，并引入了新特性。文章还涵盖了模型的微调方法、数据集格式以及在训练和部署过程中可能遇到的问题和解决方案。

摘要由CSDN通过智能技术生成

根据以下两位博主文章汇总整理：

ChatGLM2-6B、ChatGLM-6B 模型介绍及训练自己数据集实战_dream_home8407的博客-CSDN博客

ChatGLM-6B模型部署以及ptuning微调详细教程_sawyes的博客-CSDN博客

介绍
ChatGLM-6B是开源的文本生成式对话模型,基于General Language Model(GLM)框架,具有62亿参数,结合模型蒸馏技术,实测在2080ti显卡训练中上(INT4)显存占用6G左右,

优点:

1.较低的部署门槛： FP16 半精度下，ChatGLM-6B 需要至少 13GB 的显存进行推理，结合模型量化技术，一需求可以进一步降低到 10GB（INT8）和 6GB（INT4），使得 ChatGLM-6B 可以部署在消费级显卡上。
2,更长的序列长度：相比 GLM-10B（序列长度1024），ChatGLM2-6B 序列长度达32K，支持更长对话和应用。
3,人类意图对齐训练：使用了监督微调（Supervised Fine-Tuning）、反馈自助（Feedback Bootstrap）、人类反馈强化学习（Reinforce

最低0.47元/天解锁文章

「已注销」

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
ChatGLM2-6B、ChatGLM-6B 模型训练自己数据集实战

1.较低的部署门槛： FP16 半精度下，ChatGLM-6B 需要至少 13GB 的显存进行推理，结合模型量化技术，一需求可以进一步降低到 10GB（INT8）和 6GB（INT4），使得 ChatGLM-6B 可以部署在消费级显卡上。2,更长的序列长度：相比 GLM-10B（序列长度1024），ChatGLM2-6B 序列长度达32K，支持更长对话和应用。
复制链接

扫一扫

「已注销」 CSDN认证博客专家 CSDN认证企业博客

码龄2年

1: 原创

-: 周排名

-: 总排名

1267: 访问

: 等级

10: 积分

1: 粉丝

0: 获赞

1: 评论

1: 收藏

私信

关注

热门文章

ChatGLM2-6B、ChatGLM-6B 模型训练自己数据集实战 1268

最新评论

ChatGLM2-6B、ChatGLM-6B 模型训练自己数据集实战
CSDN-Ada助手: 恭喜你开启了博客创作的旅程！你的标题“ChatGLM2-6B、ChatGLM-6B 模型训练自己数据集实战”引人入胜。我期待看到你分享关于如何训练自己数据集的实用经验。不过，我想提供一个建议，希望你能在博客中更详细地介绍一下如何选择和准备数据集，以及训练过程中可能遇到的挑战和解决方案。这样可以帮助读者更好地理解和应用你的方法。祝愿你在未来的创作中取得更大的进步！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。