本地部署openvino-chaglm3-6b

最新推荐文章于 2024-05-28 17:48:53 发布

心无旁骛~

最新推荐文章于 2024-05-28 17:48:53 发布

阅读量638

点赞数 4

分类专栏：人工智能文章标签： openvino 人工智能

本文链接：https://blog.csdn.net/m0_63007797/article/details/136690443

版权

21 篇文章 9 订阅

订阅专栏

想将github下的代码拉取到本地文件夹中，再打开Windows PowerShell，执行以下命令激活环境。

python -m venv openvino_env

.\openvino_env\Scripts\activate

激活环境的时候，可能会报如下错误，这时候我们只需要输入以下命令，然后输入Y即可解决：

Set-ExecutionPolicy -Scope CurrentUser RemoteSigned

在这里插入图片描述
接下来我们使用以下命令更新pip以及安装所需要的一些依赖库。

python -m pip install --upgrade pip

pip install wheel setuptools

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

python convert.py --model_id THUDM/chatglm3-6b --output {your_path}/chatglm3-6b

–model_id - 用于从 Huggngface_hub (https://huggingface.co/models) 或模型所在目录的路径（绝对路径）。
–output - 转换后模型保存的地址

如果访问huggingface 有困难，可以尝试使用 mirror-hf 进行下载.

# LINUX
export HF_ENDPOINT=https://hf-mirror.com
# Windows Powershell
$env:HF_ENDPOINT = "https://hf-mirror.com"

Download model

huggingface-cli download --resume-download --local-dir-use-symlinks False THUDM/chatglm3-6b --local-dir {your_path}/chatglm3-6b

在这里插入图片描述

python quantize.py --model_path {your_path}/chatglm3-6b --precision int4 --output {your_path}/chatglm3-6b-int4

python chat.py --model_path {your_path}/chatglm3-6b --max_sequence_length 4096 --device CPU

在这里插入图片描述

关注

专栏目录