ChatGLM2-6B+windows10本地化部署记录

sinat_38661235

已于 2023-08-04 11:21:36 修改

阅读量209

点赞数 2

文章标签：深度学习

于 2023-08-04 11:19:33 首次发布

本文链接：https://blog.csdn.net/sinat_38661235/article/details/132097780

版权

前言

清华源代码链接 GLM2-6Bgithub
https://github.com/THUDM/ChatGLM2-6B
hugging face
https://huggingface.co/THUDM/chatglm2-6b
本地环境
-python 3.9.12
-torch 2.0.1
-cuda 11.8
-transformer 4.30.2
-单GPU训练

环境准备

从代码库下载源文件
注意tokenization_chatglm.py这些.py文件，微调时报错同这些文件可能有关

执行如下命令，安装依赖库

 pip install -r requirements.txt

源代码有3种展示界面，使用CLI需要安装charset_normalizer

pip install charset_normalizer

使用Demo2需要安装Streamlit库

pip install streamlit streamlit-chat

在这里插入图片描述
2. 本地化部署时的三种界面展示

cli_demo.py
由于是windows部署，需要修改模型加载路径的符号，下面2个文件同理

对应代码：

tokenizer = AutoTokenizer.from_pretrained("THUDM\chatglm2-6b", trust_remote_code=True)
model = AutoModel.from_pretrained("THUDM\chatglm2-6b", trust_remote_code=True).cuda()

如果碰到如下问题，可以将原来.cuda()修改为.half().cuda()
RuntimeError: expected scalar type Half but found Float
即：

model = AutoModel.from_pretrained("THUDM\chatglm2-6b", trust_remote_code=True).half.cuda()

碰到如下问题，则修改输出删除past_key_values
ValueError: not enough values to unpack (expected 3, got 2)
在这里插入图片描述
最后运行结果如下所示，为编辑器展示：

web_demo.py
基于gradio的展示界面如下所示：
如果想局域网内可用，可修改最后的代码：

demo.queue().launch(share=False, inbrowser=True,server_name='X.X.X.X',server_port=XXXX)

server_name 对应的局域网内地址，默认端口为7860，可按需修改；
如果将share参数 = True，则有一个公网访问界面，存在时间为72小时。

web_demo2.py
输入如下命令启动 streamlit run web_demo2.py --server.port 7860

sinat_38661235

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫