智谱AI通用大模型：本地部署ChatGLM3-6B开源大模型

m0_37559973

已于 2024-06-28 08:53:32 修改

阅读量5.4k

点赞数 32

分类专栏：大模型文章标签：人工智能 chatglm 智谱AI 大模型

于 2024-04-23 17:16:59 首次发布

本文链接：https://blog.csdn.net/m0_37559973/article/details/138111428

版权

一、ChatGLM3介绍

ChatGLM3 是智谱AI和清华大学 KEG 实验室联合发布的新一代对话预训练模型。

开源模型序列
模型	介绍	代码链接	模型下载
ChatGLM3-6B	第三代 ChatGLM 对话模型。ChatGLM3-6B 采用了全新设计的 Prompt 格式，除正常的多轮对话外。同时原生支持工具调用（Function Call）、代码执行（Code Interpreter）和 Agent 任务等复杂场景。	ChatGLM3	Huggingface 魔搭社区
ChatGLM3-6B-base	第三代ChatGLM基座模型。ChatGLM3-6B-Base 采用了更多样的训练数据、更充分的训练步数和更合理的训练策略。在语义、数学、推理、代码、知识等不同角度的数据集上测评显示，ChatGLM3-6B-Base 具有在 10B 以下的基础模型中最强的性能。		Huggingface 魔搭社区
ChatGLM3-6B-32k	第三代ChatGLM长上下文对话模型。在ChatGLM3-6B的基础上进一步强化了对于长文本的理解能力，能够更好的处理最多32K长度的上下文。		Huggingface 魔搭社区
ChatGLM3-6B-128k	ChatGLM3-6B-128K在ChatGLM3-6B的基础上进一步强化了对于长文本的理解能力，能够更好的处理最多128K长度的上下文。具体地，我们对位置编码进行了更新，并设计了更有针对性的长文本训练方法，在对话阶段使用 128K 的上下文长度训练。在实际的使用中，如果您面临的上下文长度基本在 8K 以内，我们推荐使