沃夫冈·瓦尔斯特:大家好!欢迎大家来到这次非常重要的会议,今天主要跟大家讲一下我的经历,我在德国的一些经验以及在德国进行的AI方面的研究。我讲的主题是团队机器人,这是现在很热的领域,以及长期自主和大规模、多模态。
第一,我们在德国总是说,AI就是信息技术的一个前沿领域。大家都知道,人工智能在一方面是计算机的分学科,但是另外一方面,它也是工程方面的分学科。不仅如此,它在认知方面也有很重要的元素,这三者结合起来再结合生物学、语言学、机器学习、心理学等等,有时候甚至是哲学也会被包含进来。因此,这是一个非常多领域的学科。
现在AI是一个重点研究的领域,我们在DFKI已经研究了30年,我们的目标是实现智能控制和在计算机系统上实现智能。当我们把AI和技术结合起来的时候会出现什么样的效果?那就是我们的产品会变得更加智能化,没有遥控,它们也能完成很多的任务。他们能够自己去规划自己的路径和行动,并且去管理资源,他们是自主的,你不需要去给他们指令。在事情发生之前,他们就能够做出反应,非常具有适应性,适应新的环境。
他们是自解释性的,这意味着AI系统能够解释他们自己的决策制定。当你去询问他们的时候,他们是自我优化的、自我学习的,有的时候甚至是有自愈功能的,这是我们的目标。所有的这些特征,当然不是在所有的系统当中都存在,有的时候只会有部分特征。
工业4.0:第四次工业革命
在德国有一个很大的趋势,我们称为工业4.0,第四次工业革命。同样,它当中也会应用到很多人工智能的技术。这个概念是在2010年由三位教授所提出的,一家软件公司我们在2011年发布了第一篇论文,今天在全世界范围内来描述工业4.0进展的论文已经超过了八万篇,并且在欧洲的总投资每年都达到了1400亿欧元,包括智能工厂等等这样一些应用。
德国人工智能研究中心,我作为研究中心的CEO,我们和很多品牌共同合作,这些公司在北京也有办事处。(上图)这些都是我们的合作伙伴,我们有时候也形成合作伙伴关系,一半是产业基金,一半是私营部门的资金。
今天我们的话题是长期自主。现在的AI只是短期自主,我们想要实现的结果,下一步是什么?我们能够给这样的系统一些目标,只有通过更长的时间才能够实现,比如一个月、半年或者两到三年的时间这样一个长度。比如你可以给一个工厂说,我想要既保证质量,同时用更少的资源等等。这样的目标一天是完不成的,因此,这个系统需要长期的目标来调整生产过程,并且实现这样的目标,那就是最终要节省资源。
在德国我们的策略就是把基础研究放在五个领域,现在我们正在开发下一代的机器学习系统,叫做EMAL,可以从低质量的数据进行学习,然后逐渐去提升自己的水平,用简单的方法,最后再提升学习的进程。第二,我们叫做IMMA,基于超连接性的沉浸式辅助,比如一些小的相机等等。在会场当中,我们就能看到一些类似的技术,叫做超连性。第三,自控系统,这是为了长期自主设计的,叫做SELA。第四是人类与机器智能的团队合作(TAMI),我们想要把AI注入到这个团队当中去。最后是可穿戴式的人工智能系统。
德国提出工业4.0的原因是什么?因为生产制造依然是德国经济一个很重要的方面,在德国,两个工作岗位有一个是依靠制造业的,制造业每年的出口金额达到1580亿欧元,主要是一些工业的机械等等。这是我们一个很重要的产业,这就意味着我们必须要在制造业当中实现一个范式的转移,IP工厂还有MES系统,要实现工厂的智能化。然后还有很多数字技术,能够了解生产的过程,让每一台机器、每一个产品都能够互联起来。
我们在几个方面进行努力,在提供很多的软件,不仅仅是给电脑和手机,很重要的一点,也给制造业工业提供软件,这些软件也是专门适用于制造行业的。在AI当中已经看到了四个阶段,大家可以看到这四个阶段是一个螺旋上升的。
第一个阶段,当AI刚刚开始的时候非常简单,那时候人们相信我们能找到一种普遍的问题解决方式,一个单一的数据结构来解决问题。当然失败了,我们只能解决一些非常简单的问题。
然后,人们就想需要更多的知识,知识就是力量,我们把知识传递给机器,这是第二个阶段,基于知识的系统,效果还不错,出现了很多成功的故事,但是也是有很大的局限,特别是很难以去把正式的知识输入进去。因此,算法很难实现。
第三阶段,学习系统。
第四阶段,认知系统。我们在这个过程中发现仅仅用机器学习来解决认知问题是不可能的。因为如果我们不能改变一些物理定律,这些物理定律可能是几百年之前就已经发现的。因此,我们受到了很多方面的局限。
为什么我们不用符号性的知识等等新的技术来实现机器学习?现在我们有最新的系统可以把知识和机器学习结合起来,这是我们未来的一种方式,我们把它称为数字化的第二次浪潮。因为,数字化是很简单的,每个人都可以做,我们也有很多的工具,只需要传输数据、存储数据就可以了。但是现在问题变成,有了这些数字我们怎么办,我们怎么样分析它们,如果去进行语义分析,如何利用这些数据。
这些我们称为机器可读数据(Machine-readable Data)。自我学习系统正如刚才所说的一样,它能够解决曾经的一些大的问题。首先最大的问题就是编程程序员的问题,必须要把程序设计得很好,才能够解决问题,比如JAVA。第二,我们称为知识处理,有事实有规则有模型等等,这个模型很好,因为它能够解释自己的推理,但是问题所在就是很难获取到足量的知识。第三,使用机器学习来获取这些知识。第四,深度学习,我们有源数据、实验数据等等,用数据来训练数据,不需要去编程,这个是一个问题,这些系统很多时候没有办法去解释它们自己的推理过程和行为。如果有很重要的决策需要做的话,如果非常信任这样一个系统,可能在法律上就会有问题,因为会有一些责任的问题。如果你是一个律师或者其它的一些职业,如果你相信了深度学习网络的话,那可能最后就会陷入麻烦当中。
我们现在在做什么?我们将符号层次的AI和亚符号层次的AI和深度学习结合起来。给大家举一个很现实的例子,如果大家去领驾照的话,你不去观察开车的方式,只是老师告诉你这个车应该怎么开可能会很简单,但是在应用当中可能会出现问题。有些路况很复杂,如何找到这样一些复杂的道路当中的规则?取决于谁来,比如到了一个路口谁先到,所以这是一个符号体系。要成为一个好的司机的话,你必须要自己去开车才行,而不只是听老师讲规则,只能够从实践当中学习,这个就是我们称为亚符号层次。不仅如此,我们还是有很多问题,现在还和很多公司一起解决的问题。
深度学习的开放问题
一个经典的问题叫做Overfitting,如果你在一个系统当中给它们太多训练数据的话,就像运动一样,可能训练过头了,这就意味着会出现一些异常的状况。比如我们在自动驾驶汽车当中试过,数据放的越来越多,给它们越来越多的驾驶视频来训练,结果这个车被撞毁了。问题在于数据太多,导致这个系统出现了混乱。
第二,数据丢失。这是一个很严重的问题,因为在有些情况当中,找不到训练数据。比如一个大熊跳到你的车里来,出现这样一些异常状况的话,实际上我们是找不到这样的例子和训练数据的。我们在Youtube上面看了很多的视频,如果说行车记录仪有记录到熊跳进车里,人们基本都删了,也不会上传到网上。因此如果熊跳到车里面的之类异常事件我们没有数据可以训练它们,这个叫做数据的丢失。
如果你给系统一些污染的数据,他们也会学习,但是就会有一些奇怪的行为,想要去删除这样异常行为的时候就很困难了。我们和Google进行合作,如何删除曾经的机器学习网络当中得到的错误行为,如果你发现一些数据受污染了,怎么办?人很厉害,我们可以删除一些错误的信息,但是在机器学习当中,要删除一些错误的受污染的数据就比较困难。有很多不同条目的数据,这些数据很难被清除和甄别出来。
第四,很弱的解释能力。系统的解释能力有时候还太弱,现在给大家展示一下我们怎么样在团队当中去使用机器人。
工业4.0:机器和人一起工作
在4.0时代当中,机器人不再是锁在笼子里面,而是和人类一起协作。这是一种全新的理念。
大家在这里看到很多机器人,一个是很著名的品牌ABB,双B系统,还有酷卡机器人叫做酷卡。这个机器人非常昂贵,大概超过一万欧元,我们就可以拥有这样一个混合团队,这个女士说“谁来帮我扛起重物”,右侧的女性仿人机器人,左侧是酷卡机器人,他们就能帮助人类去完成一些任务。
在这里我们有一个协作的例子,大家可以看到,在宝马汽车制造当中,工人与机器人协作进行冲压,这样会节约很多,如果机器人单独去做困难很多,单独人去做也会很枯燥。最后我们的解决方案让人和机器人来共同协作。
从经济的观点来看,在工业4.0时代迁回,在欧洲、日本很多公司已经决定把公司的业务外包到一些低成本的国家,比如泰国、马来西亚、越南等等。但是现在随着工业4.0的发展,人们希望很早见到他们的产品,也可能是同一天或者第二天交付,因为他们现在做的是将制造业重新迁回到客户所在地,迁回到本国,这是一个很重要的理念。同样,对中国来说也是很重要的,因为中国和德国比起来大很多,其实中国有很多不同3的省,很多省有不同的工厂,有的小一些、近一些,我们出现了这样一个迁回的趋势。
在人类还有机器人的混合团队当中出现了soft robot,软机器人。在制造过程当中还有其它一些工艺当中给人类提供一些信息还有建议,在长期自动化当中很重要的一点自我监控、自我监管,和自我认知并不是完全相同的,但是它指的就是机器可以自己运用自己所能够获取的资源。比如我们要求它在某一个时间点去到达某一个地方,那它知道路上可能会遇上坏天气,比如有大风或者大雨,那么它自己知道什么时候我可以等一下再出发。这就是说,机器能够智能地去运用自己可获取的天气信息。还有传感解读、认知、学习推理、规划以及规划认知,这是监控中很重要的一些元素。
我们现在还有在工业4.0以上新的国家的未来项目,有关自动化的系统项目,我们可以来使用机器人帮助孤寡老人,还有像在比较危险的建筑项目当中也可以运用到这样的机器人,例如灾难之后可以用机器人帮助做灾后救援。所有这些系统都有通信,它们所面对的问题,所遇到的问题都存在不确定性,这时候就需要用到机器人。
另外一个问题,模糊。比如说我们走在路上看到有一个路牌,它有特定的一些指令,我们在解读路牌的时候可能会遇到的情况就是我们不知道这个路牌所指的具体是什么意思,这样的模糊也是我们遇到的问题。还有不完整,我们的资源是无穷的,但是机器需要能够智能性地去解读这些无限的信息。
刚刚讲到了,今天我们所面临的AI时代其中很让我们激动的一点,就是现在需要键盘鼠标的领域,我们将来已经不需要键盘和鼠标了。现在我们人站在这里,只要是一个表情或者一个动作就能够给出信息,就能够帮助人和人之间来进行交流,甚至在未来让人和机器进行交流。比如像手上的手势还有面部的表情,机器可以理解我们的这些动作,甚至生物的统计学我们都可以运用在这个领域,许多小工厂的工人也都需要最新的技术。
这也就意味着我们用这种多模态的助手,其中很有趣的一点,我们用Exoskeletons(外骨骼)做的物理助手,Exoskeletons是我们手上所戴的机器手臂,让自己的手臂能够做出需要更大力量的工作,我们叫做物理助手。比如说在中国我们需要去执行这样一个动作,我们用这个机器人来执行这个动作的时候,很可能它的执行人背后的操作者其实是人在欧洲的,它可以远程来进行操作。
最后我来对比一下人类智能和现在最好的人工智能。我们可以看到,在Sensomotoric(感觉和运动)智能领域可以看到人类的智能会更好的,在这个领域我们更喜欢看人类的表现;在认知智能上,我们可以说在某些情况下人工智能是要比人类智能更好的;在情商方面机器很差,更好的是人;在社会技能方面机器刚刚才开始,人会好很多。我们有很多事情可以做。我想在此强调,机器并不是想代替人类,我们想要弥补人类在认知方面的缺陷,帮助人来做更好的工作。