20分钟本地部署ChatGLM3-6B

落叶阳光

已于 2024-01-12 08:52:29 修改

阅读量3.4k

点赞数 11

分类专栏：算法篇文章标签： chatglm 部署

于 2023-12-13 11:00:41 首次发布

本文链接：https://blog.csdn.net/xiangxiang613/article/details/134965097

版权

算法篇专栏收录该内容

33 篇文章 7 订阅

订阅专栏

准备工作

1.下载源代码：
https://github.com/THUDM/ChatGLM3

2.下载预训练模型：
https://modelscope.cn/models/ZhipuAI/chatglm3-6b/files
可以创建一个py文件，直接使用如下代码下载到本地：

from modelscope.hub.snapshot_download import snapshot_download

model_dir = snapshot_download('ZhipuAI/chatglm3-6b', cache_dir='F:/pretrained_model/chatglm3-6b/', revision='master')

注意：chatglm3-6B约11G大小

正式部署

1.创建一个虚拟环境（可选）
conda create -n chatglm3 python=3.8 --offline

2.安装requirements
pip install -r requirements.txt
在这里插入图片描述
3.修改代码：

默认调用方式，只需将这里替换为预训练模型的保存路径即可，CPU调用需要32G内存， GPU调用方式需要13G显存
GPU量化调用方式，修改为如下，需要5G

4.运行demo
cd basic_demo
streamlit run web_demo2.py
在这里插入图片描述

在这里插入图片描述
email的地方直接回车，后面就会加载模型了。

在这里插入图片描述
访问改地址即可进行对话：http://localhost:8501/

小结

和chatglm2相比，输出的结果似乎没有明显的改变，当最大的一个区别在于，chatglm2-6B有专门的int4版本，而chatglm3-gb取消了这个版本，在代码中可以直接指定量化版本。

2024.1.11补充：
发现chatglm3-6B在输出结果中存在着中英文混合、繁体字的问题，即使我的指令中强调了结果中不能出现英文单词和繁体字。也许是新的版本在训练数据中新增了一些训练数据导致的。

落叶阳光

关注

11
点赞
踩
42

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录