AI大模型为工业机器人注入“灵魂”

编者按:以大模型为代表的人工智能引发的新一轮科技革命和产业变革正向纵深发展,千行百业将面临巨大的机遇和颠覆性的挑战。在工业领域,人工智能是推进新型工业化的关键变量,工业大模型的落地生根将为制造企业探索新型工业化提供全新路径。中国电子报开设“人工智能赋能新型工业化”专栏,走进一线、走进工厂、走进企业,全方位报道以大模型为代表的人工智能技术在工业领域的生动实践。

工人师傅在屏幕上轻轻一点,工业机器人便被注入了“灵魂”,开始自动搬运货物。在短短几分钟内,一堆杂乱无序的货箱就被摆放至合理的位置,组合出特定的“垛型”。4月10日,《中国电子报》记者走进广东拓斯达科技股份有限公司(以下简称“拓斯达”)。在这里,被誉为“制造业明珠”的工业机器人正借助AI大模型完成新一轮蝶变。

码垛在三步之内即可完成

对大多数工业搬运场景而言,码垛是一个避不开、绕不过的难题。想象中的码垛只是将货物整齐放置在一个空托盘上方便后续搬运即可,然而通过此次采访,记者才了解到这个看似简单的工序背后还有那么多“门道儿”。

“码垛其实是一项非常复杂的任务,它有点儿类似于拼乐高,内核是结构工程相关的科学知识。”拓斯达总工程师张晓辉对记者说道。常见的垛型有上千种,在堆叠过程中不仅要考虑到货箱的重量、体积、尺寸、形状等特征,还要根据货箱内的物品类型判断其易破损程度、承压极限,甚至是保鲜期长短等信息,同时还要考虑每一个货箱放置的位置对整体垛型结构稳定性、安全性的影响,这需要更多的设计思维和技术能力。

现在有了AI大模型,这项工作只需要三步即可完成:首先是行业专家创建场景描述、SOP工艺流程、机器人API文档及参考代码等场景知识库,让大模型可以自动获取对应场景的知识;随后工作人员通过自然语言提出任务需求,大模型自动生成执行代码,只需微调即可使用;最后现场的工人师傅只需要点击“开始启动”按键,大模型就能自动计算出不同货箱的位置,工业机器人即可自动完成码垛。

拓斯达机器人常规测试区

据拓斯达首席技术专家陈金民介绍,以前在工业机器人使用过程中,数据散布在各个环节,机器人在物理世界中的状态和运动轨迹的改变需要产线工人基于自己的经验去判断。现在只需要把数据导入以阿里云通义千问大模型为底座开发的专用模型之中,大模型就能对人类的意图进行分析并向工业机器人下达指令,产线工人可以通过自然语言与工业机器人实现交互,这在很大程度上也降低了工业机器人的使用门槛。

“通用大模型就像一个优秀的工作助理,它基于庞大的互联网公开数据训练,已经能解决日常场景中80%的常规问题。但具体到某一个特定的行业,比如工业机器人行业,由于数据零散分布在各个环节中,且有它独特的工艺流程,只有在垂直领域进行专门的训练,才能让AI大模型更好地去解决剩下20%的专业问题。”陈金民表示。

他认为,AI大模型的核心价值是能够让人与设备实现自然语言层面的交互。未来随着AI大模型向多模态方向进化发展,还可能实现语音、视频等层面的交互,甚至是设备与环境之间的交互,届时将打破工业机器人的应用边界,让其走进更多的工业场景。

工程师不用再为机器人编程“头疼”

走进拓斯达连平生产基地,一排排形态各异、功能多样的工业机器人正在忙碌着,它们或在模拟组装零件、或在模拟棋盘对弈、或在模拟分拣货物,灵活的动作彰显着科技的力量。据拓斯达机器人工程师曾逸介绍,这些工业机器人在生产完成后,还需经过通电测试、振动测试、系统设定、原点校准等多项测试与检验,才能正式走上产线。

工程师通过AI大模型驱动工业机器人执行蛋糕裱花任务

在测试区,一个正在为蛋糕模具裱花的工业机器人吸引到了记者的注意。机器人工程师在电脑桌面上的对话框中输入“蝴蝶”一词,短短30秒,AI大模型便给出了4种不同风格的设计方案,还能生成预览样图。工程师点击“确认”后,被AI大模型驱动的工业机器人便开始往蛋糕模具上裱花。

曾逸表示,这类六轴机器人原本主要应用于3C、锂电、光伏等行业,现在有了AI大模型的加持,它也有了更大的应用空间,未来将逐渐走进一些定制化、个性化需求较高的行业场景中。像在蛋糕裱花这样的应用场景中,AI大模型不只在用户交互、图案设计等方面找到了“用武之地”,还把工程师从机器人代码编写的基础型工作中“解脱”了出来,让他们得以去做价值更高的工作。

“原本工程师需要用20分钟左右的时间去写代码,还需花费大量时间和精力根据现场情况做调试,现在只需要向大模型提出代码需求,再做些简单修改,5分钟之内就能将机器人的程序调试好,既省时又省力,还能缩短工期。”曾逸感慨道。

用AI大模型来为工业机器人编程看似简单,实际上并不容易。“一开始我们不了解通用大模型的能力范围,通过一段时间的研究与实验才发现,通用大模型对行业的渗透度不够。涉及一些具体的问题,比如某款工业机器人产品的参数、工艺知识、编程要求等,其预训练数据并没有涉及这些内容,所以大模型也无法有效解决问题,后来选择了与阿里云团队合作,训练出了一个专用于我们工业机器人产品的模型。”陈金民回忆道。

AI大模型让工业机器人的使用和学习成本得到了显著降低。曾逸向记者介绍说:“以往工程师编写程序时需要一页一页地翻看技术手册、指令集和一些相关文档,现在只需要通过自然语言与大模型对话,提出自己的需求,大模型就能给出相应的答案。这让原本需要一两个小时的学习任务,现在只需要半个小时即可完成。”

陈金民认为,传统AI技术与AI大模型并非相互对立的关系,而是一种进化、演进的关系。在这一轮生成式AI浪潮之前,工业机器人行业就已经采用了大量的人工智能技术,直至当前在来料检测、故障检测、产品质检等多个环节中依然使用的是计算机视觉等传统AI技术。不过,传统AI应用只是受限于数据、算力等方面的局限性而产生的临时性的、成本相对较低的一种解决方案。未来随着AI大模型的不断进化,其将在工业生产的各个环节得到更为广泛的应用。

AI大模型或成本土工业机器人破局关键

据国际机器人联合会统计,中国2017—2022年工业机器人安装量年均增速达到13%。中国已然成为世界上最大的工业机器人市场。然而,与欣欣向荣的市场盛况形成鲜明对比的是,根据国家统计局数据,2022年、2023年中国规模以上企业工业机器人产量增速分别为-4.8%和-2.2%。工业机器人四大家族(瑞士ABB、德国库卡、日本发那科、日本安川电机)市场销量依然居前,企业份额占比分别为13.3%、7.4%、6.4%和6.0%。

拓斯达机器人连平生产基地

受限于成本高昂、灵活性不足、安全难保障、专业人才少等问题,本土工业机器人的应用空间尚未被完全释放。AI大模型的出现或将成为本土工业机器人破局的关键。

从曾经以10万元起家、名不见经传的一家小公司,到如今营收超过45亿元,产品及服务覆盖亚、美、欧、非等50多个国家和地区的上市企业,拓斯达的成功或许很大一部分正是取决于其对市场趋势的超前洞察和对自主创新技术破釜沉舟式的探索。

拓斯达财报数据显示,过去三年,其研发投入金额已超过4亿元,研发人员占比接近总人数的一半。目前,拓斯达正在与阿里云合作,积极探索工业机器人与AI大模型的融合应用空间。“今天,在新型工业化的时代背景下,如果本土厂商能够抓住这一轮生成式人工智能浪潮带来的机遇,就有机会在特定行业、特定领域找到弯道超车的机会。”张晓辉坦言道。

一方面,以大模型为代表的生成式AI技术将大幅提高工业机器人的自主能力和认知能力,使其能解决复杂场景的应用难题;另一方面,它将极大地降低工业机器人的使用门槛,让更多人有机会用上工业机器人,同时也将吸引更多高端人才涌入这个创新赛道,激发产业发展。此外,AI大模型的加持,还将提升本土工业机器人厂商在全球市场的核心竞争力,在产业未来发展上争夺更多话语权。

“我认为,反而是在工业场景中,AI大模型会率先落地。”张晓辉表示。对于工业企业而言,由于行业整体利润率较低,AI基础模型训练所需的算力成本、人才储备太大,要拥抱大模型光靠自己是不够的;而对于IT企业而言,它们缺乏对工业场景、工艺流程的深层次理解,很难把垂直领域的大模型做深、做实,因此双方协同合作是必然选择。

阿里研究院副院长安筱鹏同样认为,制造业应该是AI大模型应用的主战场。他指出,AI大模型是重塑全球制造业竞争格局的新起点。未来所有的智能硬件都会被AI大模型所驱动。无论是何种形态的机器人、无论是何种形态的终端,其核心竞争力就在于它是被什么样智力水平的大模型所驱动。

“大模型生成代码的价值,将远远超过生成文字、图片、视频的价值,但是这个价值被远远低估了。”安筱鹏说道,“未来,中国完全有机会依托统一的消费大市场、算力服务大市场和AI服务大市场,像当年发展移动互联网产业一样,再次实现产业的繁荣和全球领先。”

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

123?spm=1001.2014.3001.5501)这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

  • 14
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值