中国电信开源星辰AI大模型：央企中首个完成LLM研发和开源的选手诞生

QbitAl

于 2024-01-17 15:35:08 发布

阅读量1k

点赞数 22

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/QbitAI/article/details/135663965

版权

中国电信的星辰AI大模型开源，成为央企中首个完成大模型研发和开源的企业。该模型在多项榜单上名列前茅，具备长文生成、问答等能力，尤其擅长长文写作。模型的算法和数据处理纯自研，拥有高质量数据集，已在企业内部和客户服务中实现应用，展现出了在网络故障分析和客户服务方面的价值。此次开源的版本包括星辰语义、语音、多模态、网络和经分五个细分模型。

摘要由CSDN通过智能技术生成

丰色发自凹非寺
量子位 | 公众号 QbitAI

没想到啊，开源大模型家族里，居然挤进来一位特别的选手：

来自央企，身份为运营商。

具体是谁？

中国电信。

所谓“不鸣则已，一鸣惊人”：

中国电信集团成立的中电信人工智能科技有限公司凭借全自研算法、精心打造的高质量数据集，发布星辰AI大模型。

其目前开源的版本在大模型知名榜单CSL上排名第五、GAOKAO排名第七、AGIEval排名第八。

什么概念？和科技公司出品的专业选手们站在了同一阵营。

现在，随着其代码和模型在Github、Gitee、HuggingFace三个平台一并可获取使用，中国电信也顺势成为央企中率先完成大模型研发和开源的选手。

加上不久之前，AI领域Fellow大满贯科学家李学龙加盟，出任电信CTO——

所以作为率先交卷大模型的央企和运营商，在大模型研发这件事上，它究竟有哪些惊艳之处？

电信大模型长什么样？

早在去年五月中旬，经过数十版模型训练与优化，中国电信就完成了百亿参数星辰AI大模型稳定版本的训练。

正式发布则是在去年7月的人工智能科技大会上，为运营商中首个。

很快，历经又一轮迭代，星辰AI大模型的千亿参数版本于11月发布。

它最大可支持96k的上下文推理，相比第一代，长文生成和理解能力提升30%。

此外，模型幻觉问题也降低了40%，并在模型量化方面取得突破——训练显存降低50%的同时，推理速度提升4.5倍。

具体来看，星辰AI大模型具备以下诸多通用能力，包括：

常识问答、写作、文本翻译润色/结构化任务、逻辑推理、数学、辅助代码生成……

模型本身则提供

最低0.47元/天解锁文章

关注

22
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。