中文能力赶超GPT4模型ChatGLM2-6B最新发布，教你使用 CPU 本地安装部署运行实现

恒TBOSH

于 2023-07-01 21:32:48 发布

阅读量1.4k

点赞数

分类专栏： GPT-4 文章标签：人工智能 gpt-3 深度学习神经网络 chatgpt

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41259045/article/details/131494621

版权

GPT-4 专栏收录该内容

9 篇文章 33 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

ChatGLM2-6B 是一个清华开源的、支持中英双语的对话语言模型，基于GLM架构，具有62亿参数。结合模型量化技术，ChatGLM-6B可以本地安装部署运行在消费级的显卡上做模型的推理和训练（全量仅需13GB显存，INT4 量化级别下最低只需 6GB 显存）虽然智商比不过 openAI 的 ChatGPT 模型，但是最近最新发布的ChatGLM2-6B 是个在部署后可以完全本地运行，可以自己随意调参，配合API模式可以实现自行构建知识库。

目录

硬件与软件准备

正式开始部署

安装 Python 3.10.6 与 pip

安装 Git Large File Storage

下载 ChatGLM2-6B

修改为 CPU 运行 ChatGLM2-6B

运行 ChatGLM2-6B

安装使用常见问题及优化

前言

ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本，在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上，ChatGLM2-6B 引入了如下新特性：

更长的上下文：上下文长度由 ChatGLM-6B 的 2K 扩展到了 32K，并在对话阶段使用 8K 的上下文长度训练，允许更多轮次的对话。多轮对话后出现复读和遗忘的情况明显减少。
更节约显存与内存：INT4 量化下，6G 显存支持的对话长度由 1K 提升到了 8K。
更高的性能：在官方的模型实现下，推理速度相比初代提升了 42%。
回答质量提升：对比题图中的 ChatGLM2-6B 与下图中的 ChatGLM-6B 的回复，ChatGLM2-6B 的回答质量提升非常明显

了解本专栏

超级会员免费看

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
中文能力赶超GPT4模型ChatGLM2-6B最新发布，教你使用 CPU 本地安装部署运行实现

ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本，在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上，ChatGLM2-6B 引入了如下新特性：更长的上下文：上下文长度由 ChatGLM-6B 的 2K 扩展到了 32K，并在对话阶段使用 8K 的上下文长度训练，允许更多轮次的对话。多轮对话后出现复读和遗忘的情况明显减少。更节约显存与内存：INT4 量化下，6G 显存支持的对话长度由 1K 提升到了 8K。更高的性能：在官方的模型实现下，推理速度相比初
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

恒TBOSH 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。