本地部署chatGLM3-6b教程

金桃不烦恼

已于 2024-05-09 12:56:24 修改

阅读量2.3k

点赞数 36

分类专栏：深度学习-大模型文章标签：语言模型 chatgpt python conda

于 2024-05-09 12:54:21 首次发布

本文链接：https://blog.csdn.net/weixin_42118737/article/details/138609130

版权

之前一直用的chatGLM2，将FastGPT本地化跑通后，现在试试将chatGLM2升级为chatGLM3。升级就比较顺利了，过程如下，该过程参考了哔哩哔哩网站的一个视频。连接如下：

23 本地化部署ChatGLM3-6B模型_哔哩哔哩_bilibili

21 OpenAI风格API调用_哔哩哔哩_bilibili

1、用conda建立虚拟环境

conda create --name chatglm3_multi python-3.11

切换到虚拟环境：

conda activate chatglm3_multi

可以使用conda env list查看已经创建的虚拟环境：

2、pytorch-GPU版本安装

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

金桃不烦恼

关注关注

36
点赞
踩
34

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

智谱AI通用大模型：本地部署ChatGLM3-6B开源大模型

m0_37559973的博客

04-23

5364

ChatGLM3 是智谱AI和清华大学 KEG 实验室联合发布的新一代对话预训练模型。

【02】ChatGLM3-6B部署：CentOS7.9本地部署ChatGLM3-6B模型

H66778899的博客

01-28

3383

【02】ChatGLM3-6B部署：CentOS7.9本地部署ChatGLM3-6B模型

1 条评论您还未登录，请先登录后发表或查看评论

Windows10下ChatGLM2-6B模型本地化安装部署教程图解

weixin_40547993的博客

07-17

1万+

ChatGLM2-6B 是开源中英双语对话模型ChatGLM-6B的第二代版本，在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上，ChatGLM2更强大的性能：基于 ChatGLM 初代模型的开发经验，我们全面升级了 ChatGLM2-6B 的基座模型。ChatGLM2-6B 使用了GLM的混合目标函数，经过了 1.4T 中英标识符的预训练与人类偏好对齐训练，评测结果。

本地部署：如何本地化部署开源大模型ChatGLM3-6B

最新发布

qq_33240556的博客

03-14

1032

ChatGLM3-6B有3个参数可以设置。max_length：模型的总token限制，包括输入和输出的tokens。temperature：模型的温度。温度只是调整单词的概率分布。它最终的宏观效果是，在较低的温度下，我们的模型更具确定性，而在较高的温度下，则不那么确定。数字越小，给出的答案越精确。top_p：模型采样策略参数。每一步只从累积概率超过某个阈值 p 的最小单词集合中进行随机采样，而不考虑其他低概率的词。只关注概率分布的核心部分，忽略了尾部。

手把手一起在本地CPU上部署ChatGLM3-6B

鲁棒最小二乘支持向量机

02-02

4075

本地CPU上部署ChatGLM-6B

20分钟本地部署ChatGLM3-6B

xiangxiang613的专栏

12-13

3831

和chatglm2相比，输出的结果似乎没有明显的改变，当最大的一个区别在于，chatglm2-6B有专门的int4版本，而chatglm3-gb取消了这个版本，在代码中可以直接指定量化版本。访问改地址即可进行对话：http://localhost:8501/email的地方直接回车，后面就会加载模型了。注意：chatglm3-6B约11G大小。

手把手教你部署并使用国产开源大模型ChatGLM3-6B

youmaob的博客

05-08

3234

部署一个自己的大模型，没事的时候玩两下，这可能是很多技术同学想做但又迟迟没下手的事情，没下手的原因很可能是成本太高，近万元的RTX3090显卡，想想都肉疼，又或者官方的部署说明过于简单，安装的时候总是遇到各种奇奇怪怪的问题，难以解决。本文就来分享下我的安装部署经验，包括本地和租用云服务器的方式，以及如何通过API调用大模型开发自己的AI应用，希望能解决一些下不去手的问题。

chatglm3-6B本地部署

qq_61757090的博客

03-17

854

在此文件夹下cmd，创建一个专门独立的虚拟环境（部署要求较高，需要运存6G，python建议3.10及以上，transformers 库版本推荐为 4.30.2，torch 推荐使用 2.0 及以上的版本）然后进行在langchain中接入大模型，先在下载的chatglm里面找到api.py，修改路径地址path为后下载huggingface的地址，并按需修改量化模式，具体如下。写下述代码运行，发送post请求，将url改为本地端口，运行代码进行测试，question：后面输入提问，测试成功即完成部署。

chatglm3-6b.zip

03-18

《构建基于大模型的智能问答系统——以chatglm3-6b与bge-large-zh为例》在当今的信息时代，智能问答系统已经成为人们获取知识、解决问题的重要工具。特别是随着深度学习技术的发展，大规模预训练语言模型在智能...

chatglm3-6b 可跑通的数据

04-01

chatglm3-6b 可跑通的数据，win 本地部署ChatGLM3-6B微调及推理过程，部署到gradio_demo,使用webui来调试和调用

ChatGLM2-6B（windows本地微调实践）

09-15

详细调试内容见文件内ReadMe文档 1、Chat GLM2模型下载 2、ChatGLM-Efficient-Tuning（Chat GLM版本1微调）...注：环境自己搭建，我的用anadconda创建的，先搭pytorch的GPU版，再添加相关模块，本地部署教程多自行部署

LLM大语言模型（一）：ChatGLM3-6B本地部署

hugo_lei的博客

12-03

5480

LLM大语言模型工程化，在本地搭建一套开源的LLM，方便后续的Agent等特性的研究。

大模型chatglm3-6b （部署本地教程）

weixin_45515807的博客

09-02

383

4.去魔搭社区下载模型https://modelscope.cn/studios/ZhipuAI/chatglm3-6b-demo/summary。2.然后根据https://blog.csdn.net/weixin_45597212/article/details/135553151安装。 1.cuda官网https://developer.nvidia.com/cuda-toolkit-archive。链接https://pytorch.org/get-started/locally/

ChatGLM3-6B本地部署及微调-部署

江冷易水寒

01-03

3330

学术小白快速本地部署大模型ChatGLM3-6B

本地部署大模型chatglm3-6b

qq_39839075的博客

06-18

551

chatglm3-6b本地部署

本地部署清华大模型 ChatGLM3

热门推荐

王清欢的博客

11-03

2万+

ChatGLM 是一个开源的、支持中英双语的对话语言模型，由智谱 AI 和清华大学 KEG 实验室联合发布，基于 General Language Model (GLM) 架构，具有 62 亿参数。ChatGLM3-6B 更是在保留了前两代模型对话流畅、部署门槛低等众多优秀特性的基础上增加了更多特性。虽然，目前 ChatGLM 比 GPT 稍有逊色，但是，在部署后可以完全本地运行，完全由自己掌控！本文介绍怎么在 Linux 服务上部署 ChatGLM3 服务，并通过多种方式使用本地部署地大模型。

如何本地化部署大模型ChatGLM3-6B？

python1234_的博客

02-13

1139

在当下的大模型领域，各家厂商纷纷推出各式产品。我精心挑选了一些技术实力较强的代表性产品，详情可见下表（其他产品因篇幅限制就不一一列举了）。实际上，虽然市场上参与者众多，但真正投入巨资进行技术研发的并不多——毕竟开发大模型需要投入的人才、训练和硬件等成本，每年动辄数亿，这对一般企业或个人来说门槛非常高。我上面表格我还没添加。

ChatGLM 本地部署指南（问题解决）

Qinghub‘博客

05-10

1402

ChatGLM 本地部署指南，部署问题解决

本地部署ChatGLM2-6B模型详解与实践

标题“本地部署ChatGLM2-6B，chatglm2-6b-int4”表明本文的主体内容将聚焦于在本地环境下实施大型语言模型ChatGLM2-6B的部署流程，并且特别关注一个名为“chatglm2-6b-int4”的特定模型版本。ChatGLM2-6B是一个基于...