早布局、大投入、守匠心，基于昇思打造“紫东太初”大模型获得2023中国算力大会年度突破成果奖

本文链接：https://blog.csdn.net/Kenji_Shinji/article/details/132761616

2023年8月19日，2023中国算力大会、第二届“西部数谷”算力产业大会在宁夏回族自治区首府银川市拉开帷幕。本次大会由工业和信息化部、宁夏回族自治区政府共同主办。

工业和信息化部党组书记、部长金壮龙在大会中指出，截至目前，全国在用数据中心机架总规模超过760万标准机架，算力总规模达到每秒1.97万亿亿次浮点运算（197EFLOPS）。算力已成为数字经济时代的关键生产力，而扎根于算力底座的人工智能大模型已经成为发展数字经济重要的基础设施。

作为本次大会“算力中国·年度突破成果”奖中唯一大模型获奖者，“紫东太初”多年研发历程深刻呼应本次大会主题：算领新产业潮流，力赋高质量发展。

“紫东太初”获“算力中国·年度突破成果”奖

放眼全球，在如今的科技大势下，人工智能大模型已经发展为建立数字经济的智能底座，国产化任务异常艰巨，国产大模型发展之路注定艰难。

一直以来，“紫东太初”坚持探索中国通用人工智能之路，由武汉人工智能研究院联合中国科学院自动化所顶尖专家力量，全力以赴国家层面重大科技战略攻关，保据“全模态”，攻坚技术高垒，奋力深挖护城河。

大会“2023中国青年论坛”上，武汉人工智能研究院院长王金桥在演讲中做了相关详细介绍。

虽然，在国际层面，全球领先产品ChatGPT背后的人工智能大模型GPT-3.5属超大规模语言模型，且在短期内迅速迭代到GPT-4。当前，大模型技术路线正在朝着多模态的方向探索前进，GPT-4成为多模态大模型的代表产品。

但是，“紫东太初”团队作为国产大模型第一梯队，早有前瞻性视野，并采取实质性投入与行动。战略性研发成果包括，早在2021年9月，“紫东太初”在1.0发布之时，就已经是千亿参数图文音多模态大模型。

王金桥院长介绍，国产大模型“紫东太初”的科技特色为：可实现文本、图片、语音、视频、3D点云、传感信号等不同模态的统一表征和学习。其技术进展体现在，做到了从三模态走向全模态。

武智院院长王金桥论坛现场发布演讲

“紫东太初”的又一国产化领先性体现在，基于华为昇腾AI和华为昇思框架，建设全栈自主可控人工智能平台，不仅研发了低代码大模型开放服务平台，而且积极建设大模型生态，完善工具链。在落地应用在摸索中倍道而进，已经用于新型医疗器械管理、大型工业质检、智能座舱等多个场景与行业。

探索国产通用人工智能路径绝非一蹴而就，“紫东太初”顶尖专家与研发、工程、算法团队历经磨砺，备尝辛苦。

研发任务艰巨，时间窗口紧迫，团队在2020年1月就决定对“紫东太初”大模型进行集团式攻关，长期坚持自研的跨模态多任务自监督学习的技术路线，从数据收集、清洗，千卡分布式训练，算子和工具链适配，模型优化和加速等多方面开展工作，经历一年半年后，初步布局初见成效，发布以多模态为特色，全球首个千亿参数大模型“紫东太初”1.0。

时光荏苒，历经三年寒冬酷暑，“紫东太初”大模型于2023年6月再次完成了新迭代，升级为以全模态为特色的“紫东太初”2.0大模型。在数字经济加速且国产化机会窗口稍纵即逝的前提下，坚持通用人工智能的实现与梦想。

从人工智能纯技术角度讲，全模态大模型基于跨模态多任务统一生成式学习框架，具备了全模态低成本协同关联优化学习融合多任务全模态能力，实现了全模态能力涌现和认知推理。

武智院院长王金桥现场演讲

王金桥院长表示，“紫东太初”大模型取得突破性进展的背后，不仅有技术和全模态的能力，更强调全栈国产化的布局。他指出，在“紫东太初”大模型始终坚持自主创新和技术原创，自研算法为核心，以昇腾AI硬件及昇思（MindSpore）AI框架为基础，依托武汉人工智能计算中心算力的有力支持，全栈国产化通用人工智能平台。

在谈到“紫东太初”大模型的应用前景时，王金桥强调，“紫东太初”已成立多模态产业联盟，整合产学研用各方资源，建立了多模态AI产业生态，在医疗、教育、制造、汽车等多个领域发挥着重要作用，未来将进一步探索深度学习自监督学习通用性的应用落地能力，为百行之业的规模化赋能，加快产业融合，打造万亿产业空间，探索通用人工智能产业化路径。

武智院院长王金桥现场演讲

开放服务平台2.0支持指令集管理、指令编写、大模型调优以及部署推理的一站式服务，在1.0版本基础上，全面升级六大功能：新增标注模块、优化训练深度、支持真实生产环境数据回流、新增可视化拖拽建模、适配全栈国产化、支持模型加密、代码加密等多类型数据加密。开放服务平台2.0全面升级产品功能和基础能力，大幅度降低大模型的构建难度，加快模型训练速度和行业应用落地速度。