中国电信
中国电信已有基座平台包括:星辰大模型平台、星河AI平台、星海大数据平台。
1+1+1+N+M的布局
1:一是打造一个运营商领先的智算云底座。目前中国电信在全国的智算规模已经达到了13个亿EFLOPS
1:二是构建一个通用大模型底座。基于天翼云智算云底座,中国电信已经推出了7B、12B、52B星辰语义大模型和多模态大模型。
1:三是沉淀一个多模态数据及底座,整合隐私计算、区块链优势能力,依托高速算力互联网,打造安全可信的灵泽2.0数据要素平台。
N:四是打造N个行业大模型,教育、任务、医疗、应急、工业等20多个行业场景大模型实现商用,中小微ICT大模型已经服务2000多家企业级客户。
M:五是打造M个企业内部大模型,推进企业内部系统全面融AI融大模型,实现中国电信内部运营数字化、业务数字化和管理数字化。
星辰大模型体系
1.星辰语义大模型:千亿参数的语义大模型,7B、12B、52B版本
2.星辰语音大模型:识别理解粤语、上海话、四川话、温州话等30多种方言
3.星辰视觉大模型:基于亿级规模数据,通过多任务协同训练,通过星河平台在 20 省部署核心算法,算法日均调用量达 3.3 亿次。
4.星辰多模态大模型:支持近20种绘画风格,中文意象理解生成能力提升30%,语义细粒度生成效果提升25%。
5.在数据方面,中国电信目前已经完成了超500TB文本数据、12亿张图文数据、日采集2PB视频数据的积累。
星辰语义大模型
是由中电信人工智能科技有限公司研发训练的大语言模型,其中7B模型基座采用1.5万亿 Tokens中英文高质量语料进行训练,12B模型基座采用3万亿 Tokens中英文高质量语料进行训练。
星辰慧答通过短信通道提供大模型服务,用户无需下载 App、直接在短信界面即可体验,同时星辰慧答业务不新增任何功能费。星辰慧答具备语言理解、文本生成、知识问答和逻辑推理等核心能力。在文本生成方面,星辰慧答可以创作诗词、润色文本、写作文章、生成代码。同时星辰慧答文生图、文生视频等多模态能力已具备,将陆续面向公众推出。
星辰语音大模型
星辰超多方言语音识别大模型。它了单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,是国内支持方言种类最多的语音识别大模型。
星辰语音理解与生成系列大模型基于数十万小时语音数据进行训练,具备精准的多语种/方言语音识别、语音实时自定义敏感词检测、超自然多音色语音生成和编辑、声音匿名等多项语音能力,支持智能会议,智慧办公、智能客服、智能语音机器人等多场景解决方案。
星辰多模态大模型
多模态大模型主要聚焦提升图文生成、图文理解能力,训练了超过12亿的各种风格数据,支持近20种绘画风格,中文意象理解生成能力提升30%,语义细粒度生成效果提升25%。星辰多模态大模型累计研发15种文生图、55种图生图能力,落地海报生成场景和卡券生成场景。
星辰视觉大模型
星辰视觉大模通过高维空间文本信息和像素信息分割和对齐,实现了视频中通过自然语言检索。该框架结合了大模型、向量检索和模型量化等技术,支持亿级规模的文搜图、图搜图的检索匹配。它还支持标注、训练、推理的一体化操作,聚焦“一句话布控”和“万物检索”两种核心业务,端到端地解决“寻人找物”,“安全生产”,“合规督查”等业务场景难题。
启明网络大模型
启明推动云网运营效率提升、云网能力开放及注智赋能,围绕五个场景:
1. 网络规划
2. 网络建设
3. 网络维护
4. 网络优化
5. 运营决策
网络大模型,提出“懂网络、懂运营、三力定位”的愿景,定义了“一五四”内涵,“一”是聚焦“一个领域,即信息通信领域,对内赋能生产,对外服务社会”; “五”指覆盖“网络规、建、维、优、营全生命周期五大类场景”;“四”是构建“算法、知识/数据、算力、服务”的四类特征,贯通网络大模型语料准备、预训练、全参精调、反馈优化、推理部署的全流程。
经分大模型
提供更贴近业务视角的意图识别和推理能力,具有多模态对话交互、智能获取多维指标数据、自动编写洞见分析报告、智能关联展现掌分数据卡片等能力。
经营分析平台满足了商机识别的三大核心需求:商情数据打标、数据洞察分析和经分报告生成。
经营分析平台的数据处理和分析能力:
能够清洗和梳理非结构化数据,确保数据质量和一致性,使数据转化为结构化、可分析的形式。
利用自然语言处理技术,对指标、维度、码值进行语义化改写,构建语义索引,提高数据检索效率。
能够结合数据结论和市场信息,辅助生成经营分析报告。
可实现对商机信息的多维度查询和分析。
星河AI平台
中国电信就推出了搭载“全网、区域、边、端”四级算力的人工智能产品和能力平台——星河AI平台,解决AI产业落地。实现“超大规模算力集群、芯片统一、云边融合、大模型引擎”的四位一体管理。星河搭载“集团、省、边、端”四级算力及调度体系,提供AI能力的统一纳管入口,支持视频数据、音频数据和文本数据接入,解决数据样本短缺问题,实现AI能力的应用封装,打通线上售卖渠道,帮助省市化解落地难题,以端到端、原子能力及标准OpenAPI三种标准模式进行交付。
星辰MaaS平台
分为算力层、数据层、通用大模型层、工具层、行业大模型层和行业应用场景。在算力方面,在全国部署千卡、万卡算力资源池;在通用大模型方面,基于自研的Telechat、星河大模型以及此次发布的星辰千亿参数的语义大模型;在工具集方面,具备了数据标注、大模型微调、大模型优化等工具以及各类AI插件。
息壤平台
算力分发网络平台“息壤”,算力接入侧首创算力插件,算力接入更高效;研发算力网关,实现算力增值;建立算力度量体系,让异构算力接入更标准。算力服务侧研发算数协同,综合评估数据传输和计算成本;引入AI大模型,洞察用户意图,实现AI算力导购;突破多层级算力调度技术,实现平台间算力协同调度。
云骁平台
一体化计算加速平台“云骁”,为大模型及应用创新提供强大计算能力,目前已经在全国各智算公有云池上线。平台性能提升方面,突破大规模智算集群统一调度管理问题,支持国产万卡资源池;推出多层次加速套件,提供数据读写加速、集合通信库加速等能力,实现算效提升。服务能力提升方面,计算、存储、网络、操作系统支持全栈国产化;突破大规模集群的故障感知、容错训练、一键诊断等技术,简化运维。
慧聚平台
一站式智算服务平台“慧聚”,全面开放算力服务,为大模型训练推理提供全栈工具链。在国产化能力方面,“慧聚”具备了自研AI框架、自研加速算子库及断点续训能力,解决国产化算力稳定性问题;在服务能力方面,可提供大规模容器调度、镜像加速和全链路监控功能,使得训练更高效、运行更稳定、服务更安全。