Verdantix——
LLM(大型语言模型)在工业领域中的十个应用
随着时间的推移,LLM(大型语言模型)的特性和能力逐渐为人们所熟知。它们展现了无与伦比的人类语言理解、出色的文本生成能力以及友好的对话指令跟随倾向。而像GPT-4和Claude等更为强大的LLM则展现出了对现实世界因果关系的深刻理解。据报道,GPT-4甚至采用了八个与GPT-3.5规模相当的LLM,通过混合专家(MoE)的方式进行配置。
尽管LLM在某些方面存在限制,如在过多上下文的情况下可能产生事实幻觉,以及在算术方面存在缺陷,但这些问题已通过精心设计的提示、RAG技术和专门的软件包装得到了解决,使LLM的行为更加接近理想的“代理”模式。OpenAI的首席执行官Sam Altman将这些进步比作“寒武纪爆炸”,意味着人工智能技术的迅猛发展和广泛应用潜力。
然而,这些技术突破也增加了监管机构采取行动的压力。例如,欧盟在2021年提出了AI法案,旨在规范人工智能的使用,确保其在法律、伦理和社会责任方面的合规性(参见Verdantix的报告《欧盟对人工智能监管发出鸣号》)。与此同时,工业领域的运营、维护和工艺安全主管也面临着巨大的挑战。他们需要优化生产过程、提高产量、减少排放,并满足日益严格的安全标准。
在快速的技术演进、日益严格的监管和社会担忧之间,存在着一定的紧张关系。然而,Verdantix在报告中指出了工业领域生成AI的十个高价值应用案例。这些案例展示了生成AI技术在解决工业领域实际问题方面的巨大潜力,为企业提供了优化生产、提高效率、减少成本并满足安全标准的新途径。
01
从庞大的数据集中提取相关的关键信息,以获得简明扼要的见解
Extracting relevant critical information from vast data sets for concise insights.
随着数字化在工业企业中的推广,由此产生的数据仓库和数据湖将存储从成千上万台物联网(IoT)设备上数十年的高频传感器测量数据,到数百万份检验报告、工单、扫描笔记和生产日志等各种数据。Salesforce Research公司的BLIP-2等功能强大的图像标注工具能够利用基于文本的数据丰富可视数据,而C3 AI和Cognite等公司的表格和文档解析工具则为LLM提供了多模态数据的可视性。通过使用检索系统向 LLM 提供文本块,操作员可以获得相关数据的对话式、基于真实情况的表述(见图5)。Cognite 的工业知识图谱为 LLM 提供了资产、流程、技术和人员之间的语义关系,以减少幻觉。基于 LLM 的信息检索系统可为操作员提供简明、相关的大局观见解,帮助他们发现低效和安全风险。
图5
02
通过自动化消除重复性行政工作
Eliminating repetitive administrative tasks through automation.
数字孪生、人工智能分析和资产管理软件等技术有助于实现工业设施多个流程的自动化,在 2022 年 Verdantix 全球企业卓越运营调查中,301 位受访者中有 87% 提到新技术的可用性是推动工厂运营数字化转型的最重要因素。2023 年 4 月,西门子宣布与微软合作,在微软团队(Microsoft Teams)中推出全新的 Teamcenter 应用程序,帮助车间工人解析和翻译自然语音,生成汇总报告,并将信息传递给相应的设计、工程或制造人员。
03
实现更强大的工业数据采集、转换和上下文关联
Enabling more robust industrial data ingest, transformation and contextualization.
如果没有合适的工具,工业数据可能非常庞大、难以捉摸且管理成本高昂。AspenTech、AVEVA、HighByte 和 Hitachi Vantara 等公司提供工业 DataOps 平台,以满足各种数据管理需求,而 Timeseer.ai 等其他公司则提供特定工具,以检测 100 多种数据质量问题并发出警报。LLM (大模型)擅长解析非结构化数据、使用推理添加上下文以及排除软件问题。作为代理部署,生成式人工智能将大大提高数据管理和协调的易用性(见图6)。Cognite 的 Industrial Canvas 平台由基于 LLM (大模型)的代理和生成式人工智能提供支持,在单一视图中实现多模态上下文关联。
图6
04
作为推理引擎,为操作和维护人员快速提供辅助意见
Offering ops & maintenance workers a quick second opinion by acting as a reasoning engine.
经过 RLHF 调整的 LLM 能够遵从自然语言指令,使它们能够以人类可以理解的方式,通过思维链或思维递归推理来探索数字环境。
通过思维链或思维递归推理,以人类可以理解的方式探索数字环境。它们可以查询工业数据湖、阅读和汇总文档,或通过与企业资产管理(EAM)、环境健康安全(EHS)或资产性能管理(APM)软件的连接查看实时数据。作为代理(根据用户指令执行任务)部署的 LLM 可以承担许多琐碎的知识收集和基本分析工作,简化一线工人的任务,例如获取设备中特定资产(如泵)的列表,记录其服务历史,并预测哪些资产下个月需要维修(见图6)。虽然即使是当今最强大的 LLM(如 GPT-4 和 Claude)有时也会犯错,但如果利用适当的软件支架来引导他们的注意力,他们对世界的一般知识就能为操作员、经理和工程师提供快速、无需判断的理智检查,或对关键决策提供第二意见(见图4)。
图4
05
自动对资产维护任务进行分类和优先排序
Automatically categorizing and prioritizing asset maintenance tasks.
LLM 擅长分析非结构化数据(无论是直接分析、从文件中提取文本分析,还是从人工智能视觉模型生成的标题分析),具有无限的耐心,可以持续监控上传到工业数据池的实时信息。可利用此类功能从数据中提取情感信息,将其与运营优先事项进行比较,并向设备和企业决策者提供相应的摘要。同样,LLM 可以使用风险和关键度量筛选成千上万份检查报告、图像字幕和可用的通话记录,以检测即将发生的事故,并通过代理式流程自动化向现场管理人员及时发出警报。
06
通过语音口述进行检查和维护,实现完全免提操作
Facilitating fully hands-free operation with voice dictation for inspections and maintenance.
十多年来,智能手机上已经部署了苹果 Siri、谷歌助手等多种形式的听写系统。然而,这些系统在识别特定领域词汇或持续提取复杂指令方面能力有限。2022 年,OpenAI 发布了开源的 Whisper 模型——一种多功能、通用的语音到文本系统,该系统在 68 万小时的文字记录基础上进行了训练。这种模型可以与 LLM 和视觉系统相结合,为虚拟助手提供信息,并为现场操作人员提供免提的音频和视觉信息。虽然 Whisper 和类似模型目前的计算成本较高,但企业从准确转录中获得的价值正在推动创新,并使经过训练可识别特定行业术语的紧凑型模型得以快速发展。此类系统将为一线工人提供基于软件的推理引擎和虚拟助手,帮助他们完成复杂的任务,尤其是在偏远地区。
07
利于PLC编程普及化
Democratizing asset programmable logic controller (PLC) programming.
计算机编程语言需要严密的逻辑,而互联网上围绕软件开发的深入讨论无处不在,这意味着法律硕士们已经学会将代码与自然语言紧密联系在一起。在工业领域,ABB、罗克韦尔自动化公司(Rockwell Automation)和西门子(Siemens)等机器供应商为其产品编程提供了大量公开文档。微软旗下的 GitHub Copilot 于 2021 年推出,2022 年开始广泛使用,为软件开发人员提供了复杂的自动完成功能,包括根据自然语言描述生成函数的能力。同样,2023 年 5 月,ABB 研究公司发表了一篇论文,详细介绍了OpenAI 的 ChatGPT/GPT-4 使用自然语言描述 PLC/DCS 功能,生成语法正确的 IEC 61131-3 结构化文本代码,并展示有用的推理技能,以提高控制工程师的工作效率,同时提供控制叙述。
08
为全员提供低代码、自然的对话式界面
Delivering a low-code, natural, conversational interface to the whole workforce.
LLM 在全球人类语言与工业数据库和软件解决方案中使用的大量代码或领域语言之间提供了一个通用翻译层。如今,许多工业软件解决方案都依赖于精心设计的图形用户界面 (GUI)、特定应用布局和广泛的用户培训计划,以帮助客户从中获得最大价值。然而,在现场解决问题可能需要使用不同的工具和软件解决方案——图形用户界面限制太多,竞争厂商之间的互操作性有限。LLM 能够通过 Python 等通用编程语言利用代码级接口,使用户能够利用平台的强大细粒度功能。2023 年 6 月,Hexagon 推出了 HxGN EAM Python 框架,而 C3 AI 则通过其适用于各种编程语言的类型系统提供代码级功能。同样在 6 月,Cognite 推出了 Copilot 产品,利用 LLM 的自然交流能力,将其作为通用的低代码接口,连接到其解决方案的最先进功能,从而为更多的一线工人、数据科学家、设施管理人员和高管提供了通过他们喜欢的媒介与关键信息进行交互的能力。
09
开发更先进的人工智能视觉系统,以优化生产质量
Developing more advanced AI-based vision systems for production quality optimization.
在 2020 年之前,计算机视觉和 LLM 是截然不同的技术,当时的视觉转换器(ViT)模型部署了为语言设计的架构,以分析一系列图像补丁,从而更好地理解视觉数据。2021 年,OpenAI 的 CLIP 模型利用 ViT 识别复杂的视觉特征;2023 年 6 月,Salesforce Research 的 BLIP-2 部署了基于 CLIP 的 ViT 与 LLM,实现了与图像的对话交互。通过对视觉模型和 LLM 进行微调以提供特定领域的见解,生产线上的质量管理将提高准确性,领域专家的技能也将得到更好的利用。其他基于视觉的模型可以帮助填补缺失的数据。2023 年 5 月,SparkCognition 宣布与壳牌石油公司合作,部署基于图像的生成式人工智能,将进行地震勘测所需的时间从 9 个月缩短到 9 天。
10
为培训提供丰富可视的 3D 虚拟环境
Providing richly visual 3D virtual environments for training.
潜在扩散模型,如 OpenAI 的 DALLE-2 和 Stability AI 的 Stable Diffusion,可根据稀疏的自然语言提示生成令人信服的逼真环境。利用稳定扩散衍生模型的开源项目(如 ControlNet)可对图像生成进行精细控制,包括用特定领域的场景来丰富虚拟环境。另一个项目是英伟达™(NVIDIA®)的NeuralField-LDM,它使用分层潜在扩散模型生成逼真、复杂的三维场景。这些技术将为一线工人提供前所未有的身临其境的培训环境,有助于知识转移和降低操作风险。
那么,如何系统的去学习大模型LLM?
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
作为一名热心肠的互联网老兵,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。
但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
所有资料 ⚡️ ,朋友们如果有需要全套 《LLM大模型入门+进阶学习资源包》,扫码获取~
篇幅有限,部分资料如下:
👉LLM大模型学习指南+路线汇总👈
💥大模型入门要点,扫盲必看!
💥既然要系统的学习大模型,那么学习路线是必不可少的,这份路线能帮助你快速梳理知识,形成自己的体系。
路线图很大就不一一展示了 (文末领取)
👉大模型入门实战训练👈
💥光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
👉国内企业大模型落地应用案例👈
💥两本《中国大模型落地应用案例集》 收录了近两年151个优秀的大模型落地应用案例,这些案例覆盖了金融、医疗、教育、交通、制造等众多领域,无论是对于大模型技术的研究者,还是对于希望了解大模型技术在实际业务中如何应用的业内人士,都具有很高的参考价值。 (文末领取)
👉GitHub海量高星开源项目👈
💥收集整理了海量的开源项目,地址、代码、文档等等全都下载共享给大家一起学习!
👉LLM大模型学习视频👈
💥观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。 (文末领取)
👉640份大模型行业报告(持续更新)👈
💥包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
👉获取方式:
这份完整版的大模型 LLM 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
😝有需要的小伙伴,可以Vx扫描下方二维码免费领取🆓