逐步进行glm安装,没有langchain

阿明 -李明

已于 2023-07-27 14:28:04 修改

阅读量491

点赞数

文章标签： linux ubuntu 运维

于 2023-07-17 00:00:34 首次发布

本文链接：https://blog.csdn.net/weixin_44094615/article/details/131754264

版权

该文详细介绍了如何在阿里云A10计算卡上配置环境，包括安装NVIDIA驱动、更新资源、安装conda、创建Python3.8环境并激活自定义的limingGLM虚拟环境。接着，作者下载并安装Git，从清华源克隆GLM模型，使用conda和pip管理依赖。最后，通过gradio运行Web演示，展示了GLM模型的使用。

摘要由CSDN通过智能技术生成

一、选择阿里云进行薅羊毛

选择3个月的A10的计算卡，注意要增加NAS，

选择镜像：stable-diffusion-webui-env:pytorch1.13-gpu-py310-cu117-ubuntu22.04

二、安装基础环境，激活我个人的limingGLM的虚拟环境

1、先看看显卡安装情况

nvidia-smi

说明显卡已经安装正常

2、各种资源的更新，虽然阿里云很多但是我还是在环境下更新一个版本吧

sudo apt-get update

3、安装gcc编译器(可选，系统中通常已有)：

sudo apt install build-essential

4、安装Python，以3.8为例：sudo apt install python3.8，其实安装3.7应该也够吧

5、开始安装anconda，原来很多人安装mini，但是反正资源多，就安装完整版

先现在一个完整的软件包：

wget -c https://repo.anaconda.com/archive/Anaconda3-2021.05-Linux-x86_64.sh

6、按照安装conda

bash Anaconda3-2021.05-Linux-x86_64.sh

然后一路回车加Yes，后面是答案，安装到/root下这个目录，如果要是修改就要改目录，我拦着没有修改

Anaconda3 will now be installed into this location:
/root/anaconda3

确认安装目录后，继续进行压缩解包；

7、运行成功后，进行初始化shell
conda init 运行这个，这里要求重新启动才能生效

8、我先制定一个python 3.8的一个环境，给GLM用，我就叫limingGLM

conda create -n limingGLM python==3.8 -y

然后我查看我现在系统里面虚拟环境

conda env list

看到了吧，有个limingGLM是我的虚拟环境

9、应该激活这个limingGLM环境，但是conda activate limingGLM 没有激活，提示需要bash的init

输入： bash 后在输入 conda activate limingGLM 才激活，下面就是成功：

三、开始下载GLM模型

1、安装git，但是原来环境概率是有的，我在浪费一下资源；

sudo apt install git

很快安装完毕，继续要下载GLM模型了

2、从清华开源安装

git clone https://github.com/THUDM/ChatGLM-6B.git

这个时间可能有点长；等等

3、进入程序目录，根据配置文件进行安装(由于我再bash里面,其实就在conda的环境里

cd ChatGLM-6B

#pip install -r requirements.txt

pip3 install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

可以增加 sudo
这个命令是错误的（conda install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple）

运行中，估计不要多久，应该模型下载时间长。

4、现在可以下载模型了

从hugging face下载所有文件下来，放到model文件夹内。

模型下载到本地吧，git-lfs方式下载；

apt install git-lfs

git-lfs clone https://huggingface.co/THUDM/chatglm-6b

这里会很慢很慢，应该2个小时下载，可以洗洗睡了，竟然1个小时不到结束了，继续。

四、运行一些基础的GLM的程序了

pip install gradio （这个是web页面资源，需要安装）

1、运行web演示

在运行之前，需要先修改web_demo.py文件中的模型地址，具体为第5行与第6行，具体如下

tokenizer = AutoTokenizer.from_pretrained("model_path", trust_remote_code=True)
model = AutoModel.from_pretrained("model_path", trust_remote_code=True).half().cuda()

我找了一下，我的model_path = "。/chatglm-6b" -->/前面有个小点别忘记了。

大写的ChatGLM-6B 是存着所有的演示程序

我用的A10，显存应该是24G，如果比较小，就要在cuda这里压缩一下，比如：