中国电信开源星辰AI大模型:央企中首个完成LLM研发和开源的选手诞生

中国电信的星辰AI大模型开源,成为央企中首个完成大模型研发和开源的企业。该模型在多项榜单上名列前茅,具备长文生成、问答等能力,尤其擅长长文写作。模型的算法和数据处理纯自研,拥有高质量数据集,已在企业内部和客户服务中实现应用,展现出了在网络故障分析和客户服务方面的价值。此次开源的版本包括星辰语义、语音、多模态、网络和经分五个细分模型。
摘要由CSDN通过智能技术生成
丰色 发自 凹非寺
量子位 | 公众号 QbitAI

没想到啊,开源大模型家族里,居然挤进来一位特别的选手

来自央企,身份为运营商。

具体是谁?

中国电信

所谓“不鸣则已,一鸣惊人”:

中国电信集团成立的中电信人工智能科技有限公司凭借全自研算法、精心打造的高质量数据集,发布星辰AI大模型

其目前开源的版本在大模型知名榜单CSL上排名第五、GAOKAO排名第七、AGIEval排名第八。

什么概念?和科技公司出品的专业选手们站在了同一阵营。

现在,随着其代码和模型在Github、Gitee、HuggingFace三个平台一并可获取使用,中国电信也顺势成为央企中率先完成大模型研发和开源的选手。

加上不久之前,AI领域Fellow大满贯科学家李学龙加盟,出任电信CTO——

9be936aaa70f2ca6698d30732fba5740.png

所以作为率先交卷大模型的央企和运营商,在大模型研发这件事上,它究竟有哪些惊艳之处?

电信大模型长什么样?

早在去年五月中旬,经过数十版模型训练与优化,中国电信就完成了百亿参数星辰AI大模型稳定版本的训练。

正式发布则是在去年7月的人工智能科技大会上,为运营商中首个

很快,历经又一轮迭代,星辰AI大模型的千亿参数版本于11月发布。

它最大可支持96k的上下文推理,相比第一代,长文生成和理解能力提升30%。

此外,模型幻觉问题也降低了40%,并在模型量化方面取得突破——训练显存降低50%的同时,推理速度提升4.5倍。

具体来看,星辰AI大模型具备以下诸多通用能力,包括:

常识问答、写作、文本翻译润色/结构化任务、逻辑推理、数学、辅助代码生成……

93cce61f59c54859ba5ba37310cb9f12.png
1c1e0837ac12208c4eac5c5e9f74f9a1.png

模型本身则提供

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值