ubuntu22.04CPU部署ChatGLM笔记

最新推荐文章于 2024-05-10 15:36:36 发布

Raine_Yang

最新推荐文章于 2024-05-10 15:36:36 发布

阅读量1.1k

点赞数

分类专栏：实习记录文章标签： python 深度学习 LLM ChatGLM 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Raine_Yang/article/details/131293027

版权

本文记录了在Ubuntu 22.04系统上使用CPU部署ChatGLM的详细步骤，包括环境配置、模型下载、调用模型以及解决内存不足问题的过程。通过创建conda环境、安装依赖、下载模型到本地并覆盖相应文件，成功部署了ChatGLM模型。在运行中发现模型加载时内存需求较高，通过增加swap分区解决了内存不足问题。虽然CPU运行速度较慢且存在英文对话中的中文问题，但整体部署过程顺利完成。

摘要由CSDN通过智能技术生成

ChatGLM官方Github链接 https://github.com/THUDM/ChatGLM-6B

我就是一步步按照官方部署教程完成ChatGLM部署。对于官方文档里面详细描述的部署步骤不进一步赘述。这里主要记录几个自己遇到的问题

1 安装环境及依赖

ChatGLM部署需要安装python, pytorch等环境，为了防止现有电脑里的python环境版本不符合出现问题，我们可以使用anaconda管理多个独立的python环境
这里我们使用占用内存更小的miniconda
下载地址：https://docs.conda.io/en/latest/miniconda.html#linux-installers

Miniconda自带python，注意下载python版本在3.10

下载安装miniconda后，系统默认处于base环境，我们创建新环境名为chatglm

conda create -n chatglm --clone base
conda activate chatglm

官方github里的requirements.txt文件列出了ChatGLM所有依赖及版本，下载官方guthub库到本地后，执行

pip install -r requirements.txt

这里如果下载速度慢可以将pip更换为国内源，这里我选择了清华源

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple/

2 下载模型到本地

在官方的原示例中，模型文件由transformer远程下载，速度会非常慢（ChatGL

最低0.47元/天解锁文章

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Raine_Yang CSDN认证博客专家 CSDN认证企业博客

码龄4年

184: 原创

23万+: 周排名

74万+: 总排名

21万+: 访问

: 等级

2106: 积分

200: 粉丝

173: 获赞

58: 评论

1176: 收藏

私信

关注

热门文章

分类专栏

最新评论

实现langchain-ChatGLM API调用客户端（及未解决的问题）
敲键盘的小夜猫: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性。感谢博主的分享，文章思路清晰，图文并茂，详略得当。期待博主持续输出好文！三连支持。
Arduino实现压力传感器（使用HX711模块）
2301_80170511: 请问一下，压力传感器的数据怎么输出到屏幕上啊
Arduino实现压力传感器（使用HX711模块）
Auroras_azure: 请问一下博主，如何在这个程序中设置加一个蜂鸣器模块，当重量超过2kg蜂鸣器报警，期待博主回复，谢谢
Ubuntu安装ROS2完整教程和踩坑经历
开挖机的程序猿: 引用「sudo sh -c ‘echo “deb [arch=amd64,arm64] http://pa」这里有错误吧，试了好几次提示权限不够，换成双引号就好了sudo sh -c "echo 'deb [arch=amd64,arm64] http://packages.ros.org/ros2/ubuntu $(lsb_release -cs) main' > /etc/apt/sources.list.d/ros2.list"
ROS小车研究笔记3/11/2023：多点导航及其源码实现
xukun0316: 请问找到方法了吗

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。