最新开源对话大模型glm-4-9b-chat本地部署使用

不二的AI笔记

于 2024-06-07 15:31:06 发布

阅读量3.3k

点赞数 7

分类专栏： Python AI人工智能文章标签： python 大模型 glm4

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/damiaomiao666/article/details/139527489

版权

Python 同时被 2 个专栏收录

24 篇文章

订阅专栏

2 篇文章

订阅专栏

简介

GLM-4-9B 是智谱 AI 推出的最新一代预训练模型 GLM-4 系列中的开源版本。在语义、数学、推理、代码和知识等多方面的数据集测评中，GLM-4-9B 及其人类偏好对齐的版本 GLM-4-9B-Chat 均表现出较高的性能。除了能进行多轮对话，GLM-4-9B-Chat 还具备网页浏览、代码执行、自定义工具调用（Function Call）和长文本推理（支持最大 128K 上下文）等高级功能。本代模型增加了多语言支持，支持包括日语，韩语，德语在内的 26 种语言。我们还推出了支持 1M 上下文长度（约 200 万中文字符）的模型。

本文以glm-4-9b-chat为例，部署环境如下：

Ubuntu 22.04.4 LTS
显卡 RTX 4090（Nvidia驱动550.78）
内存 32G

部署步骤

1.glm4代码下载

git clone https://github.com/THUDM/GLM-4

2.模型文件下载(大约36G)

# 安装git lfs大文件存储插件
curl -s https://packagecloud.io/install/repositories/github/git-lfs/script.deb.sh | sudo bash
apt install git-lfs
# 激活插件
git lfs install

# 下载模型文件
git clone https://www.modelscope.cn/ZhipuAI/glm-4-9b-chat.git

3.修改trans_cli_demo.py指向模型所在路径

vim trans_cli_demo.py

# MODEL_PATH修改为如下，/root/glm-4-9b-chat换成你的模型目录
MODEL_PATH = os.environ.get('MODEL_PATH', '/root/glm-4-9b-chat')

4.运行模型

# 安装python虚拟环境
cd /root
apt install python3.10-venv
mkdir -pv .virtualenvs/glm-4-9b-chat
python -m venv .virtualenvs/glm-4-9b-chat
source /root/.virtualenvs/glm-4-9b-chat/bin/activate

# 安装依赖包，依赖包有很多，耐心等待安装完成
cd /root/GLM-4/basic_demo
pip install -r requirements.txt

# 运行模型
python trans_cli_demo.py

然后可以像下面这样跟glm-4-9b-chat对话（在4090上模型的回答速度还是很快的）：

在这里插入图片描述
同时，你还可以用nvtop命令看到有一个进程在GPU上运行：

在这里插入图片描述
完！

不二的AI笔记

博客等级

码龄9年

65
原创

209
点赞

423
收藏

2795
粉丝

关注

私信

热门文章

分类专栏

操作系统实战 2篇
工具 4篇
Docker 7篇
Elasticsearch 1篇
VPN 2篇
AI人工智能 2篇
Flask 7篇
PaddlePaddle 1篇
运维 2篇
MySQL 1篇
自动化 1篇
Nginx 1篇
Celery 1篇
汇编实战 14篇
Python 24篇
FastAPI 2篇
JavaScript 1篇
小游戏 1篇
Redis 4篇
MongoDB 2篇
数据库 6篇
Windows 2篇
Linux 8篇
Vim 3篇
算法 1篇

最新评论

Hyper-V安装Win11虚拟机并设置vGPU显卡直通
孤龙临风: 感谢作者的分享，全网唯一一篇实现此功能的文章，按照步骤操作下来成功了。有个问题请教一下，重启之后，默认的监视器还是显示的Microsoft Hyper-V视频，怎么才能让默认是NVIDIA的显卡的监视器呢？我试着将Microsoft Hyper-V视频的禁用之后，显示反而不正常了。期待您的回复。
OpenVpn服务端与客户端之间双向访问
qq_40952597: 请教一下，你是怎么处理在vpn服务端内的请求时走vpn，请求别的地址，如果正常上网之类的不走vpn呢，vpn服务器的带宽如果很低，客户端正常上网是个问题
OpenVpn服务端与客户端之间双向访问
chenbaker: route 172.16.2.0 255.255.255.0 这个172的IP，在你的拓扑图里并没有，这是代表啥？
安装docker版redis集群
普通网友: 干货满满，实用性强，博主的写作风格简洁明了，让人一目了然。文章涵盖了很多实用的知识点。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
OpenVpn服务端与客户端之间双向访问
CSDN-Ada助手: 推荐 MySQL入门技能树：https://edu.csdn.net/skill/mysql?utm_source=AI_act_mysql

大家在看

最新文章

目录

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。