阿里云交互式建模(DSW)
(1)首先注册阿里云账户,进入人工智能平台选择交互式建模,在此处创建实例。
(2)创建实例的过程中,首先为实例命名,此处的命名可为ChatGLM_Original。推荐选择GPU规格
(3)实例创建完成后,需等待一段时间进行初始化环境的配置。
依赖更新与源码克隆
(1)首先需要下载git-lfs,用于克隆ChatGLM的模型(文件极大),命令如下:
apt-get update
apt-get install git-lfs
git init
git lfs install
(2)从ChatGLM3-6B的GitHub仓库中克隆模型的源码:GitHub - THUDM/ChatGLM3: ChatGLM3 series: Open Bilingual Chat LLMs | 开源双语对话语言模型
git clone https://github.com/THUDM/ChatGLM3
cd ChatGLM3
(3)使用 pip 安装依赖。(使用阿里云的镜像,下载速度和成功率极高)
pip install -r requirements.txt
(4)预训练模型的克隆,方法是从 ModelScope 中下载
git lfs install
git clone https://www.modelscope.cn/ZhipuAI/chatglm3-6b.git
ChatGLM3-6B模型的运行
(1)ChatGLM3-6B模型提供了两种已经写好的运行方式:命令行 Demo启动和网页版 Demo 启动,,接下来主要讲解命令行 Demo启动
(2)路径修改:
首先需要修改目录,ChatGLM3 提供了三种使用方式:命令行 Demo,网页版 Demo 和 API 部署;在启动模型之前,需要找到对应启动方式的 python 源码文件 cli_demo.py,web_demo.py,openai_api.py 中修改。把下载好的 chatglm3-6b 预训练模型文件放到 ChatGLM3 仓库目录同级,如果是从 ModelScope 下载的话注意目录层级,模型加载需要修改本地模型路径;在cli_demo.py文件中修改为:
MODEL_PATH = os.environ.get('MODEL_PATH', '/mnt/workspace/chatglm3-6b')
(2)命令行demo启动:
python cli_demo.py