【AI学习】人工智能的几种主义

无意翻开了杨立昆的《科学之路》,书前有好多人作序,数了一下,八个人的序言,说明,至少有八个人读过这本书。其中黄铁军教授讲到了机器学习的发展历程。
人工智能发展历程中的各种主义,对于外行人大概都是如我一般的一头雾水。我读书一般是懒得看序的,这次却发现这些写序的水平都蛮高。
黄教授讲:符号主义主张(由人)将智能形式化为符号、知识、规则和算法,认为符号是智能的基本元素,智能是符号的表征和运算过程。

我觉得,要更多了解符号主义,可能需要从人工智能这个概念的诞生说起。这件事嘛,要从我们通信行业的祖师爷,香农老爷子说起。曾经以为,老爷子三十多岁完成了信息论的开宗立派事业,就退隐山林养老悠闲度日了,因为之后就没听说老爷子在通信领域再露面了。该做的大事都做完了,用句现在流行的话,剩下的事情就是雕花了,然后自然就该骑牛出关后,“莫知其所终”了。记得上研的时候,听导师讲turbo码,大概有这么一句:后来人用来四十年的时间,终于发现,香农证明香农界的方法,其实也是达到香农界的实现方法。后人,真是不济啊……年初读书,才知道,原来香农老爷子一直没闲着,知道通信行业也就这样了,得赶紧的帮着徒子徒孙们琢磨其他的道路。
“克劳德·香农是一手创立了信息论和密码学的另一个天才,也是把二进制位命名为‘比特’的人。他也在人工智能的早期就深深涉足其中。香农造出了一只能自己走迷宫的机器老鼠,一个能下国际象棋的程序。他在晚年还有其他一些稀奇古怪的发明,比如能抛球杂耍的机器人。1955年,香农和另几个先驱约翰·麦卡锡、马文·明斯基、纳撒尼尔·罗切斯特一起倡议举办一场夏季研讨会,把科学家和数学家聚拢起来,用了几个星期的时间深入讨论人工智能。**达特茅斯(Dartmouth)研讨会于1956年举办,持续了六个星期,是第一场专注这个领域的研讨会,探讨(并且命名)了人工智能。**这几个星期的讨论产生了一些关键的思想,主导了这个新领域随后数十年的研究。”
达特茅斯夏季人工智能研究专项提案是1955年8月31日提出,“我们提议于1956年夏季在新罕布什尔州汉诺威市举办一个为期两个月的、由十个人参加的专项研究。这个研究的出发点是这么一个猜想:**人类学习能力的每个方面,或者说智能的其他特征,原则上都可以精确地得到描述,所以也可以造出机器来予以模拟。**项目组致力于探讨如何让机器使用语言、形式化的抽象和概念,来解决目前只有人类能解决的问题,并且自我改进。我们认为,只要一组精心挑选出来的科学家并肩作战一个夏季,我们就能在其中一个或多个问题上取得重大进展。”

在这份建议书中,“人工智能”(artificial intelligence, AI)这一术语被首次提出,用来表示“人工所制造的智能”。
从建议书对人工智能的定义可以理解,符号人工智能是最早、最成功的人工智能形式之一,应该也是顺应潮流,一方面是智能被精确描述的这个出发点,另一方面是数十年前刚发展出来的新逻辑思想作为理论基础。

然后,黄教授继续讲到符号主义的问题:符号主义有过辉煌,但不能从根本上解决智能问题,一个重要原因是“纸上得来终觉浅”:人类抽象出的符号,源头是身体对物理世界的感知,人类能够通过符号进行交流,是因为人类拥有类似的身体。计算机只处理符号,就不可能有类人感知和类人智能,人类可意会而不能言传的“潜智能”,不必或不能形式化为符号,更是计算机不能触及的。
我私下以为,符号主义这种期望通过符号来精确描述智能的目标,还是太难了。对人的要求太高。
在这里插入图片描述

黄教授接着讲连接主义:与符号主义自顶向下的路线针锋相对的是连接主义。连接主义采取自底向上的路线,强调智能活动是由大量简单单元通过复杂连接后并行运行的结果,基本思想是:既然生物智能是由神经网络产生的,那就通过人工方式构造神经网络,再训练人工神经网络产生智能。……连接主义的困难在于,他们并不知道什么样的网络能够产生预期智能,因此大量探索归于失败。
在这里插入图片描述
机器学习从20世纪80年代中期开始引领人工智能发展潮流,杨立昆给出了很通俗的定义:学习就是逐步减少系统误差的过程,机器学习就是机器进行尝试、犯错以及自我调整等操作。机器学习对人工智能最重要的贡献是把研究重心从人工赋予机器智能转移到机器自行习得智能。近年来,最成功的机器学习方法是深度学习和强化学习。
深度学习是连接主义和机器学习相结合的产物,最大的贡献是找到了一种在多层神经网络上进行机器学习的方法,杨立昆和约书亚·本吉奥、杰弗里·辛顿因此获得2018年度图灵奖。深度学习首先回答了什么样的神经网络可以训练出智能,包括多层神经网络和卷积神经网络,也回答了训练(学习)方法问题,包括受限玻尔兹曼机模型、反向传播算法、自编码模型等。深度学习对连接主义的重大意义是给出了一条训练智能的可行途径,对机器学习的重大意义则是给出了一个凝聚学习成效的可塑载体。

黄教授还讲到了进化主义: 人工智能的第三条路线是行为主义,又称进化主义,思想来源是进化论和控制论。生物智能是自然进化的产物,生物通过与环境以及其他生物之间的相互作用发展出越来越强的智能,人工智能也可以沿这个途径发展。这个学派在20世纪80年代末90年代初兴起,近年来颇受瞩目的波士顿动力公司的机器狗和机器人就是这个学派的代表作。行为主义的一个分支方向是具身智能,强调身体对智能形成和发展的重要性。行为主义遇到的困难和连接主义类似,那就是什么样的智能主体才是“可塑之才”。
强化学习的思想和行为主义一脉相承,可追溯到1911年行为心理学的效用法则:给定情境下,得到奖励的行为会被强化,而受到惩罚的行为会被弱化,这就是强化学习的核心机制——试错。1989年,沃特金斯提出Q学习(Q-learning),证明了强化学习的收敛性。2013年,谷歌子公司DeepMind将Q学习和深度神经网络相结合,取得AlphaGo、AlphaZero(阿尔法元)和AlphaStar等重大突破。最近,DeepMind更是强调,只需要强化学习,就能实现通用人工智能。

说到强化学习,前日读过腾讯研究院的《具身智能的10个真问题|3万字圆桌实录》,非常值得一读的文章。其中聊到强化学习,有这么一段生动的讲述:强化学习就像巴普洛夫养狗一样,一按铃给它吃的,以后一按铃它就过来了,它是通过这样的方式。这个的好处是你不需要具体教它怎么做这件事,只要告诉它孰好孰坏,它就会不停地尝试,找到能让你满意的那个做法。
在这里插入图片描述
最后的总结:“人工智能经典学派有三个:符号主义、连接主义和行为主义。符号描述和逻辑推理不是智能的基础,而是一种表现,**读写都不会的文盲就拥有的“低级”智能才更基础。**因此,连接主义和行为主义虽然困难重重,但有着更强的生命力,从中发展出的深度学习和强化学习两套方法,成为当今支撑人工智能的两大主要方法。”

当然,黄教授讲述的内容更加广阔而博大,我这里主要就是更多的理解一下人工智能的几个主义。雾里看花,走得更近一些,也可以看的稍微清楚一些。
然而,黄教授的更有格局的观点,也还是摘录一下,也算是本人为传播思想略尽绵薄之力。在总结了人工智能过去的发展后,黄教授继续展望着未来:
从节省能源角度看,机器智能确实不应该从头再进化一次,而是应该以进化训练好的生物神经网络为基础,这就是纯粹的连接主义:构造一个逼近生物神经网络的人工神经网络。1950年,图灵的开辟性论文《计算机与智能》中就表达了这个观点:“真正的智能机器必须具有学习能力,制造这种机器的方法是:先制造一个模拟童年大脑的机器,再教育训练它。”这也是类脑智能或神经形态计算的基本出发点。相关科研实践开始于20世纪80年代,基本理念就是构造逼近生物神经网络的神经形态光电系统,再通过训练与交互,实现更强的人工智能乃至强人工智能。

除了改进训练对象的先天结构,训练不可或缺的另一个要素是环境。环境才是智能的真正来源,不同环境孕育不同智能。人们往往把今天人工智能系统的成功归结为三个要素:大数据+大算力+强算法,其中数据是根本,另外两个要素主要影响效率。训练更强智能,需要更大数据,这是智能发展的基本规律。有人提出“小数据”方法和小样本学习,标榜要颠覆大数据方法,给出的典型理由是人类和动物能够举一反三,不需要大数据。这种观点貌似有道理,其实言过其实,因为他们忘记或者故意隐瞒了实现举一反三的主体是大脑,而大脑本身是“进化大数据”训练的结果。所谓小数据方法,是以大数据“预训练”为前提的。仅靠小数据不可能训练出复杂智能,道理很简单——小数据没有蕴含足够的可能性和复杂性,所谓的强大智能又从何而来呢?

但即便是大数据,也不能完整有效地表达环境,数字孪生能更全面地刻画物理环境,更好地保留环境自有的时空关系,因此也能够哺育出更强的人工智能。物理世界的模型化本来就是科学最核心的任务,以前从中发现规律的是人类,未来这个发现主体将扩展到机器。

行文至此,我们已经从人工智能发展史中小心翼翼地挑出三根靠得住的基本支柱:一是神经网络,二是强化学习,三是环境模型

展望未来,人工智能的发展途径有三条。一是继续推进“大数据+大算力+强算法”的信息技术方法,收集尽可能多的数据,采用深度学习、注意力模型等算法,将大数据中蕴藏的规律转换为人工神经网络的参数,这实际上是凝练了大数据精华的“隐式知识库”,可以为各类文本、图像等信息处理应用提供共性智能模型。二是推进“结构仿脑、功能类脑、性能超脑”的类脑途径,把大自然亿万年进化训练出的生物神经网络作为新一代人工神经网络的蓝本,构造逼近生物神经网络的神经形态芯片和系统,站在人类智能肩膀上发展机器智能。第三条技术路线的核心是建立自然环境的物理模型,通过强化学习训练自主智能模型。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值