没想到啊,开源大模型家族里,居然挤进来一位特别的选手:
来自央企,身份为运营商。
具体是谁?
中国电信。
所谓“不鸣则已,一鸣惊人”:
中国电信集团成立的中电信人工智能科技有限公司凭借全自研算法、精心打造的高质量数据集,发布星辰AI大模型。
其目前开源的版本在大模型知名榜单CSL上排名第五、GAOKAO排名第七、AGIEval排名第八。
什么概念?和科技公司出品的专业选手们站在了同一阵营。
现在,随着其代码和模型在Github、Gitee、HuggingFace三个平台一并可获取使用,中国电信也顺势成为央企中率先完成大模型研发和开源的选手。
加上不久之前,AI领域Fellow大满贯科学家李学龙加盟,出任电信CTO——
所以作为率先交卷大模型的央企和运营商,在大模型研发这件事上,它究竟有哪些惊艳之处?
电信大模型长什么样?
早在去年五月中旬,经过数十版模型训练与优化,中国电信就完成了百亿参数星辰AI大模型稳定版本的训练。
正式发布则是在去年7月的人工智能科技大会上,为运营商中首个。
很快,历经又一轮迭代,星辰AI大模型的千亿参数版本于11月发布。
它最大可支持96k的上下文推理,相比第一代,长文生成和理解能力提升30%。
此外,模型幻觉问题也降低了40%,并在模型量化方面取得突破——训练显存降低50%的同时,推理速度提升4.5倍。
具体来看,星辰AI大模型具备以下诸多通用能力,包括:
常识问答、写作、文本翻译润色/结构化任务、逻辑推理、数学、辅助代码生成……
模型本身则提供了近100个prompt模版任务,包括营销宣传、PPT制作、评价分析、行业分析等,方便大伙拿来就用: