本地部署自己的chatglm大模型01——先让模型在本地跑起来

一、下载

demo:https://github.com/THUDM/ChatGLM3?tab=readme-ov-file
model(按需下载):https://huggingface.co/THUDM/chatglm3-6b
在这里插入图片描述

二、安装依赖

1、在虚拟环境(.venv)中拉取requirements.txt中指定的依赖包

(.venv) E:\Agi\ChatGLM3-main> pip install -r requirements.txt

2、安装pytorch(GPU版):https://pytorch.org/get-started/locally/#windows-pip

  • 看清楚自己的cuda版本,不知道的命令行通过nvidia-msi查看。如果是12.x,按下面的下载
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

在这里插入图片描述

三、执行Demo

1、修改cli_demo.py中的model路径(比如模型放在了E:/Agi/chatglm-6b)

MODEL_PATH = os.environ.get('MODEL_PATH', 'E:/Agi/chatglm-6b')

2、执行主程序,和chatglm对话。如果到此一切ok,那你可以关掉这篇博客了;如果有报错,请继续看第四部分
在这里插入图片描述

四、报错解决

问题1

  • ChatGLMTokenizer‘ object has no attribute ‘sp_tokenizer

解决方法

  • requirements.txt中指定的transformers依赖版本过高,考虑从>=4.39.x降低到==4.33.2

问题2

  • Cannot install -r requirements.txt (line 4) and tokenizers>=0.15.0 because these package versions have conflicting dependencies

解决方法

  • 按提示,降tokenizers版本。如transformers指定==4.33.2,考虑将tokenizers降低到<0.14.0

问题3

  • RuntimeError: “LayerNormKernelImpl“ not implemented for ‘Half

解决方法

  • 1、pytorch安装的有问题
    核对下载的pytorch版本是否正确
  • 2、显卡不支持
    核对下载的模型精度、显卡计算能力是否匹配。比如RTX4060的计算能力版本是8.9,能够支持FP16数据格式类型。
    https://developer.nvidia.com/cuda-gpus
    https://docs.nvidia.com/deeplearning/tensorrt/support-matrix/index.html#hardware-precision-matrix
    在这里插入图片描述在这里插入图片描述

问题4

  • expected scalar type Half but found Float

解决方法

  • 在调用模型的cli_demo.py文件,指定数据格式类型为半精度,即初始化时增加.half()
model = AutoModel.from_pretrained(MODEL_PATH, trust_remote_code=True, device_map="auto").half().eval()

问题5

  • ValueError: not enough values to unpack

解决方法

  • 将stream_chat方法出参从3个改成2个,删掉past_key_values。参考https://juejin.cn/post/7293786247654441001
for response, history in model.stream_chat(tokenizer, query, history=history, top_p=1,
                                                                   temperature=0.01,
                                                                   past_key_values=past_key_values,
                                                                   return_past_key_values=True):

参考:

  • https://www.bilibili.com/read/cv29866295/
  • https://zhuanlan.zhihu.com/p/642841588
  • 8
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值