使用Ubuntu在本地部署ChatGLM3-6B的详细教程

最新推荐文章于 2024-05-21 16:13:39 发布

Redamancy_Dreamboat

最新推荐文章于 2024-05-21 16:13:39 发布

阅读量1.4k

点赞数 19

文章标签： ubuntu linux 运维

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_74972544/article/details/137690975

版权

本文详细指导如何配置Python环境（推荐3.10及以上，transformers4.36.2，Torch2.0+），检查硬件需求（至少8GB内存和5GB显存），包括从HuggingFace官网或镜像下载ChatGLM3-6B模型，通过PyCharm和命令行创建和激活conda环境，安装依赖，以及在网页版和命令行两种模式下运行模型。

摘要由CSDN通过智能技术生成

一：环境配置

1.python环境

python 版本推荐3.10 - 3.11

transformers 库版本推荐为 4.36.2

torch 推荐使用 2.0 及以上的版本，以获得最佳的推理性能

2.硬件环境

查看显卡配置：nvidia-smi

运行 Int4 版本的 ChatGLM3-6B的最低配置：

内存：>= 8GB

显存：>= 5GB（1060 6GB,2060 6GB）

二：下载 ChatGLM3-6B模型

1. 从 Hugging Face 官网下载模型。

使用这种方法，下载模型需要先安装Git LFS

git lfs install

git clone https://huggingface.co/THUDM/chatglm3-6b

如果访问不到Hugging Face的官网则可以使用镜像网站：

THUDM/chatglm3-6b · HF Mirror (hf-mirror.com)

2.从GitHub官网下载运行模型所需要的文件：

GitHub - THUDM/ChatGLM3: ChatGLM3 series: Open Bilingual Chat LLMs | 开源双语对话语言模型

三：运行ChatGLM3-6B模型

1.通过pycharm中命令行建立conda环境

conda create -n chatglm3-demo python=3.11

2.执行conda环境

conda activate chatglm3-demo

出现如下界面则成功：

3.下载模型所需要的依赖

pip install -r requirements.txt

4.本地运行模型：

1.加载本地模型文件，并量化

2.网页版界面启动

进入composite_demo模块，运行如下代码：streamlit run main.py

cd composite_demo #进入模块
streamlit run main.py # 启动网页版界面

网页版界面：

3.命令行模式启动

进入basic_demo模块，在命令行运行cli_demo.py文件启动命令行模式的ChatGLM3-6B模型，输入如下命令启动：

cd basic_demo # 进入模块
python cli_demo.py # 运行py文件

命令行界面：

这样使用ubuntu在本地部署ChatGLM3-6B模型就部署好啦

Redamancy_Dreamboat

关注

19
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
使用Ubuntu在本地部署ChatGLM3-6B的详细教程

进入composite_demo模块，运行如下代码：streamlit run main.py。这样使用ubuntu在本地部署ChatGLM3-6B模型就部署好啦。显存：>= 5GB（1060 6GB,2060 6GB）推荐使用 2.0 及以上的版本，以获得最佳的推理性能。使用这种方法，下载模型需要先安装Git LFS。查看显卡配置：nvidia-smi。1.python环境。
复制链接

扫一扫

Redamancy_Dreamboat CSDN认证博客专家 CSDN认证企业博客

码龄2年

6: 原创

110万+: 周排名

8万+: 总排名

6733: 访问

: 等级

174: 积分

128: 粉丝

112: 获赞

3: 评论

91: 收藏

私信

关注

热门文章

最新评论

在Java项目中集成ChatGLM3-6B模型
guoshuo08: 如果是使用stream流返回应该怎么写尼？
在Java项目中集成ChatGLM3-6B模型
CSDN-Ada助手: 恭喜用户成功发布了第三篇博客，题目听起来就很专业！对于在Java项目中集成ChatGLM3-6B模型这个话题，你的分享无疑会帮助到很多同行。接下来，我建议你可以考虑分享一些实际应用案例，或者深入探讨一些技术细节，这样可以让读者更好地理解和运用这个模型。期待你的下一篇作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。