GLM-4: 开源多语言多模态对话模型

钟云仪

于 2024-09-13 21:45:53 发布

阅读量600

点赞数 3

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gitblog_07316/article/details/142223732

版权

GLM-4: 开源多语言多模态对话模型

GLM-4 GLM-4 series: Open Multilingual Multimodal Chat LMs | 开源多语言多模态对话模型项目地址: https://gitcode.com/gh_mirrors/gl/GLM-4

项目基础介绍和主要编程语言

GLM-4 是由智谱AI推出的开源多语言多模态对话模型系列。该项目主要使用Python进行开发，依赖于PyTorch和transformers等深度学习框架。GLM-4-9B 是该系列中的开源版本，旨在提供一个高性能、多功能的对话模型，支持多种语言和模态的输入输出。

项目核心功能

GLM-4-9B 的核心功能包括：

多语言支持：支持包括日语、韩语、德语在内的26种语言，能够进行多语言对话。
多模态对话：支持图像和文本的混合输入，具备视觉理解能力，能够进行多模态对话。
长文本处理：具备长文本输出能力，单轮对话大模型输出可超过1万token，支持最大128K上下文。
高级功能：包括网页浏览、代码执行、自定义工具调用（Function Call）等。

项目最近更新的功能

GLM-4 项目最近更新的功能包括：

OpenAI API兼容的服务端：2024年9月6日，增加了在GLM-4v-9B模型上构建OpenAI API兼容的服务端。
长上下文问答中的细粒度引用：2024年9月5日，开源了使LLMs能够在长上下文问答中生成细粒度引用的模型longcite-glm4-9b以及数据集LongCite-45k。
Lora adapter的vLLM演示代码：2024年9月4日，增加了在GLM-4-9B-Chat模型上使用带有Lora adapter的vLLM演示代码。
长文本输出能力：2024年8月15日，开源了具备长文本输出能力（单轮对话大模型输出可超过1万token）的模型longwriter-glm4-9b以及数据集LongWriter-6k。
模型依赖升级：2024年8月12日，GLM-4-9B-Chat模型依赖的transformers版本升级到4.44.0。

这些更新进一步增强了GLM-4-9B的功能和性能，使其在多语言、多模态和长文本处理方面更加强大。

GLM-4 GLM-4 series: Open Multilingual Multimodal Chat LMs | 开源多语言多模态对话模型项目地址: https://gitcode.com/gh_mirrors/gl/GLM-4

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

钟云仪 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。