中国信通院2023年工业大模型技术应用与发展报告指出,工业大模型作为人工智能发展的重要里程碑,正引领新一轮的工业应用变革。以下为详细整理内容:
大模型技术概述
-
定义与特点:大模型是一种在海量数据和强大计算资源支持下训练得到的具有超大规模参数(如GPT系列从1.17亿至1.48万亿参数)的深度学习模型。其中,狭义上多指大语言模型,广义还包括CV(计算机视觉)、多模态等多种类型的模型。
-
应用场景:大模型技术广泛应用于生成式AI领域,显著提升文本、图片、视频等内容的生成能力。例如,ChatGPT是基于GPT模型的典型产品,实现自然语言处理领域的广泛应用。
-
目标使命:大模型被视为通用人工智能(AGI)新范式的组成部分,虽然已经展现出强大的学习与生成能力,但还欠缺完备的推理与认知能力。
工业大模型的发展与应用路径
-
发展趋势:大模型+大数据+大算力共同驱动着工业AI的发展,工业大模型在各行业渗透迅速,其在制造业的应用引发了热烈讨论和积极预期。比如,阿里认为未来十年制造业将是AI大模型的重要战场。
-
分类与特征:工业大模型是在Transformer框架基础上,通过大量通用数据预训练以达到良好的通用性,并且具备应用于工业各个环节的能力,模型参数量通常超过十亿级别,部分已达到万亿规模。
-
落地方式:目前已有超过30个工业领域的大模型,主要通过三种核心赋能方式:
- 直接基于通用底座对行业进行赋能。
- 对通用底座进行场景化适配调优或开发外挂插件工具。
- 针对工业或具体任务进行针对性开发。
-
实例应用:如PLC编程中使用YonGPT进行代码生成;星火大模型用于特定工业场景优化;科大讯飞推出的一体机将大模型应用于私有化部署等。
工业大模型的核心能力和适用边界
-
核心能力:工业大模型适用于涉及复杂智能任务的大场景,需要丰富的基础数据支撑,并且问题边界应清晰可界定。其关键能力包括语言理解、生成创作、识别/模拟/预测以及多模态处理等。
-
应用场景细分:
- 大语言模型:广泛应用于工业问答交互和内容生成,如罗克韦尔公司结合数字孪生与AIGC技术提供设备状态咨询;西门子与微软合作基于GPT开发代码生成工具等。
- 专用大模型:聚焦研发环节的辅助设计和药物研发创新,如华为的盘古药物分子大模型提高药物发现效率,DeepMind利用大模型进行CAD草图构建等。
- 多模态大模型与视觉大模型:在装备智能化和视觉识别领域初步探索,如国家电网的电力大模型提高了异常图像检测效率;哈工大和斯坦福大学的研究表明,此类模型能用于工业异常检测并增强机器人复杂环境下的执行能力。
技术体系与挑战
-
算力需求与解决方案:端侧和边缘侧推理的大模型专用计算有望成为趋势,针对不同精度要求,显存需求各异,例如对于10亿参数的大模型,在不同的精度格式下所需显存不同。同时,已有硬件厂商推出一体机(如华为星火一体机)和芯片(爱芯元智AX650N芯片)优化大模型在终端的推理速度。
-
数据与知识工程融合:高质量的工业数据对大模型性能至关重要,而大模型与知识工程、专家系统及知识图谱等固有技术的深度融合是工业应用探索的方向之一。
综上所述,工业大模型不仅在多个维度拓展了工业AI的技术边界,而且通过与现有技术和产业实践的紧密结合,正在逐步重构智能制造体系,推动工业生产迈向更高水平的智能化和自动化阶段。