问答系统 ChatGLM3部署实战

AI算法网奇

已于 2024-06-04 00:22:01 修改

阅读量567

点赞数 1

分类专栏：深度学习基础文章标签：人工智能

于 2024-04-25 11:51:30 首次发布

本文链接：https://blog.csdn.net/jacke121/article/details/138185032

版权

深度学习基础专栏收录该内容

166 篇文章 17 订阅

订阅专栏

运行basic_demo/web_demo_gradio.py 报错：

lallma3

llama好用结合llamaindex做RAG

本地部署lallma3 16g显存ok

本地部署Llama3教程，断网也能用啦！_llama3 本地部署-CSDN博客

ChatGLM3

GitHub - THUDM/ChatGLM3: ChatGLM3 series: Open Bilingual Chat LLMs | 开源双语对话语言模型

依赖项

pip install -U langchain-community

pip install -U langchain
pip install -U arxiv

pip install ffmpy

pip install peft

显卡不够报错解决

pip install transformers accelerate -U

运行basic_demo/web_demo_gradio.py 报错：

OSError: Incorrect path_or_model_id: 'THUDM\chatglm3-6b'. Please provide either the path to a local folder or the repo_id of a model on the Hub.\

解决方法：

pip install transformers accelerate -U

MODEL_PATH = os.environ.get('MODEL_PATH', 'THUDM/chatglm3-6b')
MODEL_PATH = r'F:\project\llm\THUDM---chatglm3-6b'
TOKENIZER_PATH = os.environ.get("TOKENIZER_PATH", MODEL_PATH)

多卡运行报错：

ImportError: Using `low_cpu_mem_usage=True` or a `device_map` requires Accelerate: `pip install accelerate`

解决方法：

pip install transformers accelerate -U

然后修改代码：

    # tokenizer = AutoTokenizer.from_pretrained(TOKENIZER_PATH, trust_remote_code=True)
    tokenizer = AutoTokenizer.from_pretrained(TOKENIZER_PATH,trust_remote_code=True, low_cpu_mem_usage=True)
    model = AutoModel.from_pretrained(MODEL_PATH, low_cpu_mem_usage=True,trust_remote_code=True).eval()
    # model = AutoModel.from_pretrained(MODEL_PATH, low_cpu_mem_usage=True,trust_remote_code=True, device_map="auto").eval()