SiliconCloud上新：GLM-4-9B，通用能力超越Llama 3

OneFlow深度学习框架

已于 2024-06-19 13:40:24 修改

阅读量2k

点赞数 7

分类专栏：前沿技术文章标签： llama GLM4 智谱 Llama3 SiliconCloud

于 2024-06-06 08:56:54 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/OneFlow_Official/article/details/139521367

版权

前沿技术专栏收录该内容

152 篇文章 151 订阅

订阅专栏

今天，智谱发布了第四代 GLM 系列开源模型：GLM-4-9B。

GLM-4-9B 系列模型包括：基础版本 GLM-4-9B（8K）、对话版本 GLM-4-9B-Chat（128K）、超长上下文版本 GLM-4-9B-Chat-1M（1M）和多模态版本 GLM-4V-9B-Chat（8K）。GLM-4-9B 模型具备了更强大的推理性能、更长的上下文处理能力、多语言、多模态和 All Tools 等突出能力。

目前，SiliconCloud已上线GLM-4-9B-Chat开源模型。欢迎试用：

https://cloud.siliconflow.cn/models/text/chat/17885302522

注意！！！GLM-4-9B-Chat已进入“6.18购物狂欢节”福利包：“每人送3亿token”。注册即可畅玩（截止6月18日23:59）：

www.siliconflow.cn/zh-cn/siliconcloud

据智谱介绍，在预训练方面，他们引入了大语言模型进入数据筛选流程，最终获得了10T高质量多语言数据，数据量是ChatGLM3-6B模型的3倍以上。同时，它们采用了FP8技术进行高效的预训练，相较于第三代模型，训练效率提高了3.5倍。在有限显存的情况下，他们探索了性能的极限，并发现6B模型性能有限。因此，在考虑到大多数用户的显存大小后，他们将模型规模提升至9B，并将预训练计算量增加了5倍。

Github：https://github.com/THUDM/GLM-4

关于SiliconCloud

SiliconCloud是集合主流开源大模型的一站式云服务平台，为开发者提供更快、更便宜、更全面的模型API。

目前，SiliconCloud已上架包括GLM-4-9B-Chat、DeepSeek V2、Mixtral、Llama 3、Qwen、SDXL、InstantID在内的多种开源大语言模型、图片生成模型，支持用户自由切换符合不同应用场景的模型。同时，SiliconCloud提供开箱即用的大模型推理加速服务，为生成式AI应用带来更高效的用户体验。

真正在乎大模型推理性能和成本的开发者，绝不会错过SiliconCloud。更何况，现在还送3亿token。快试试吧：

www.siliconflow.cn/zh-cn/siliconcloud

OneFlow深度学习框架

关注

7
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

OneFlow深度学习框架 CSDN认证博客专家

CSDN认证企业博客

352: 原创

2万+: 周排名

5488: 总排名

184万+: 访问

: 等级

5148: 积分

5522: 粉丝

2264: 获赞

433: 评论

3411: 收藏

私信

关注

热门文章

分类专栏

最新评论

比肩GPT4，没有显卡也能用Llama-3.1-405B
Memory of the blue ocean: 有一点不足，没找到联系上下文的应答方式
AI市场的资本谜团与流向
ConnorOne: efewfewewfwefewf
比肩GPT4，没有显卡也能用Llama-3.1-405B
HRSYS: SiliconCloud推出Llama-3.1，号称媲美GPT4，亮点是8B版本免费，无需显卡也能运行，对广大开发者真是大好消息，降低了大模型的使用门槛，值得尝试。
比肩GPT4，没有显卡也能用Llama-3.1-405B
DebugDiva: Llama-3.1-405B确实厉害，参数量大，支持多语言，还能无压力处理长文本，对话自然流畅。这模型开源了，对社区贡献大，开发者们有福了。它在多项指标上超越了GPT-4和Claude 3.5 Sonnet，真是让人眼前一亮。不过，使用时得注意资源消耗，毕竟这么大个模型，运行起来硬件得跟上。
比肩GPT4，没有显卡也能用Llama-3.1-405B
DebugDiva: Llama-3.1-405B确实给人眼前一亮，SiliconCloud让大模型应用变得更亲民，开发者能直接用API，省时省力。特别是对没显卡的小伙伴，这波操作太友好了。模型性能超越GPT-4，开源社区又迎来强援，期待看到更多创新应用。

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。