作为经验主义探究的计算机科学:符号和查询


作为经验主义探究的计算机科学:符号和查询(omputer Science as Empirical Inquiry: Symbols and Search)


Allen Newell 和 Herbert A. Simon

 



关键字和短语:符号(symbols), 查询(search),科学(science),计算机科学(computer science), 经验主义(empirical), 图灵(Turing),人工智能(artificial intelligence), 智能(intelligence),表处理( list processing),认知( cognition),启发法( heuristics),

问题解决(problem solving).

 

【注:】作者1975的年图灵演讲。

 

计算机科学是对环绕在计算机周边现象的研究。当这个学会的缔造者们把自己叫做计算机器组织(Association for Computing Machinery)的时候,对这一点非常清楚。这个不仅仅是硬件还有编程的动态机器就是我们研究的机体。

 

这是第10届图灵奖。在这平台上先于我们的那九个人已经提供了对计算机科学的九种不同观点。对于我们的机体,即“计算机”而言,可以在许多级别上且从许多角度去进行研究。我们对今天出现在这里深感荣信,而且也会提供一种观点,这是一种在我们被提及的科学工作中的完全观点 。我们期望说计算机科学是经验主义探究(empirical inquiry)。

 

我们的观点只是许多观点中的一种;先前的那些演讲说的很明白。虽然如此,即便把所有这些演讲收集到一起,试图覆盖我们科学的整个范围还是不可能的。它的许多基本方面在最近10年的授奖中没有涵盖到。而且如果这个时刻会来临的话(肯定不会快),当有了彻底改变,当从所有方面讨论计算机科学时,就会是再次循环一刻的开始。对作将“演讲者将给出年度的冲刺以赶上小积累”比喻做兔,将“在其恒定行进中的科学与技术发展”比喻做龟,那么科技在其稳固前行中已有增长的获益(For the hare as lecturer will have to make an annual sprint to overtake the cumulation of small, incremental gains that the tortoise of scientific and technical development has achieved in his steady march) 。每年都会生成一个新的落差并需要一次新的冲刺,因为对科学而言是没有必然结局的。

 

计算机科学是一种经验主义的学科。我们可以把它称之为一种实验科学,不过就像是天文学、经济学和地质学,其特有的某些观察形式及经验并不契合老套狭义实验方法。说起来这些学科是实验性的。每一台新构建起来的机器就是一次实验。对这机器的实际上的构建给自然提出了一个问题;并且我们通过观察操作中的机器去听取答案,而且通过所有解析的及可得的测量手段去分析它。机器亦或程序两者不是黑匣子;它们是被设计出来的包括软硬件的人工产品,并且我们可以打开它们看看里面啥样。我们可以把它们的结构和其行为关联,并从一次单一实验中获取许多经验教训。我们无需构建100个拷贝(比方说,一个定理证明器),去从统计上证明说它还没有克服以希望方式进行查询的那种组合爆炸。据对程序的少数几次运行之观测揭示出的缺陷,就让我们进入到下一次的努力中。

 

我们有许多理由造计算机和构建程序。我们建造它们以服务社会,且它们作为工具能施行社会的经济任务。但作为基础科学家,我们所以构建机器和程序是作为发现一种新现象的方式,并对我们早已所知的现象进行分析。社会对此常常感到困惑,相信说计算和程序仅仅是为经济使用而生的(或者作为引领到一个诸如此类发展序列的嫁衣 )。需要了解的是环绕在计算机周边的现象是深奥晦涩的,需要许多实验去估量它们的本性。需要了解的是,就像在任何科学中一样,从这种实验中的获取及理解是对持续追求新技术的回报;并且正是这些能够制造设备的技术帮助了社会获取其目标。

 

不过我们在这里的目的不是从外部世界去请求理解。是要检查我们科学的一个层面,通过经验主义探究去发展新的基础性理解。这最好是通过插图的方式作出。如果在这种场合我们选择了来自我们自己研究领域的实验,我们要请求原谅。正如将会现象出来的一样,这些例子涉及到(特别是在其早年的)人工智能的整个发展。它们更多不是依赖我们的个人贡献。并且即便是在我们作出直接共享的地方,这也是大家共同合作的结果。我们的合作者特别包括有 Cliff Shaw,和他一起我们在50年代末期那激动人心的岁月中形成了一个三人组 。不过我们也和许许多多在 Carnegie-Mellon 大学的同事和学生一起共事。

 

由于时间关系仅述两例。第一例是开发一个符号系统的概念。第二例是开发启发式搜索概念。这两种概念对理解信息是如何被处理的及智能是如何达到的有深远影响。然而,它们对挖掘完人工智能的全部领域而言还差得很远,尽管对我们而言它们在显示计算机科学这一部分的根本知识特性上有用处。

 

 

I. 符号和物理符号系统(Symbols and Physical Symbol Systems)

需要在一个非常基本的层面上对计算机科学中知识的一个基础性贡献作解释,什么是符号。这种解释是一种对自然的科学命题。这是从经验中长久的、渐渐的衍生出来的。

 

在智能行为的根底里有符号存在,当然了,这是人工智能的首要话题。就那档子事而言,它对所有计算机科学而言是首要问题。因为所有信息是被为终端服务的计算机所处理的,而且我们是通过它的能力来衡量一个系统的智能的,这种能力是:面对外在变化、困难及环境任务所加的复杂性去追求确定的本源。这个为了获取智能而对计算机科学作的概述当正待完成的任务范围有限时是含混的,这是因为此时该环境中的所有变异可以被精确预见到。当我们把计算机扩展到一个更加全局复杂及对知识敏感的任务时(比如我们试图把它们做成能够在完全不可预见的自然世界中自我控制的主体)这会变得愈加明显。

 

我们就系统对智能行为之需的理解是慢慢出现的。这就是组合,因为没有单独基本事物可以解释在其中展示的智能。没有智能原理,正如没有重要原理可传达出生命的本意。不过,没有一简单的“神仙” 并不就是说没有对智能的结构化需求了。一个这种需求就是能够存储及操纵符号的能力。为了说明这个科学问题,我们可阐述一下 Warren McCulloch 的著名文献的标题 [1961]:什么是智能会去使用的一个符号,什么样的智能可以使用符号?

 

 

定性结构定律(Laws of Qualitative Structure)

所有科学都对其研究系统的本质作了刻画。这些刻画的性质总是定性的,这是因为它们设定了这样的术语:可以在其中发展出更加详细的知识。它们的本质常可以被非常精炼概括的表述所把握。某人可以对这些概括定律作决断,由于这些定律的有限具体性,当比较而言对科学的总和贡献甚少时,这不是“它们是最重要结果”的史据所能显示的。

 

 

生物学中的细胞学说(The Cell Doctrine in Biology )。就定性结构定律而言的一个好例子是生物学的细胞学说,它宣称所有活体组织的基本构建单元是细胞。细胞展现出大量的各异形式,虽然它们都有一个由细胞质环绕的细胞核,整个被一层膜覆盖。不过历史上来说,这种内部结构不是细胞学说的一部分;它是由集中调查而得的后来特征。细胞学说几乎完全是由伴有一些关于一个细胞可以多大的不甚明确观念(我们上述所给出的描述)所传达出来。虽然这个定律作用在生物学上,但这个定律的作用范围是极大的,而且在该领域渐渐被接纳前其失去的动力是很大的。

 

 

地质学中的板块构造论(Plate Tectonics in Geology)。地质学对定性结构定律提供了有趣的例子,所以有趣是因为它在最近的10多年才获得了承认,并且仍清晰的记得其地位的上升。地质板块理论断言地球表面是一巨大板块的聚集(总共有一打),这些板块 互上互下互对移动(以地质学的速度而言)到地球的中心,在那里它们失去了其特性。由于火山地域及地震活动,深海山脊及诸如此类, 所以板块移动要对大陆和海洋的形状及相关位域负责。随着对速度与大小的少数附加细节,基本理论就被确定下来。在它能对一系列都是非常巨大的细节作出解释前这当然不可接受(比如,要对介于西非和南美的东北的层理约定 stratification agreements 与植物群、动物群进行解释)板块构造理论是高度定性的。现在可以接受说,整个地球看上去随处都在对其提供证据,因为我们使用它的术语来观察世界。

 

 

疾病的病菌理论(The Germ Theory of Disease)只是在一个世纪多前 Pasteur 宣布了疾病的病菌理论,一个产生了一个医学革命的定性结构。该理论认为大多数疾病是由于在体内的小单细胞活体出现及增加而引发的,并且传染病的这些组织从某宿主到另一个宿主的传播当中存在。该精巧理论的一大部分在于识别出相关于特殊疾病的组织。描述它们以及追踪它们的生命历程。该疾病的病菌理论事实上有许多例外,即许多疾病都不是由细菌产生的,但无法撼动其重要性。该理论告诉我们要去寻求特定的一种原因;该理论并不坚持认为我们总会找到这种原因。

 

 

原子论学说(The Doctrine of Atomism)。原子论学说对我们刚描述过的三条定性结构定律提供了一个有趣比照。因为它是来自Dalton 的工作和他关于化学物质由固定比率组成的说明,该定律提供了一个典型的定性结构:元素是由小而不统一的粒子组成的,每一个元素中都不相同。但由于原子基本种类如此简单且多样性上有限,定量理论很快就明确表达出来,它吸收了原定性假设的所有概括结构。就细胞、板块理论及细菌而言,它们的结构差异巨大,以至于其后的定性原理表现互相独立,而且其各自对整个理论贡献是清晰可辨的。

 

 

结论(Conclusion)定性结构律在科学中随处可见。我们一些最伟大科学发现的身影就在其中。正如例子所示,它们通常设置了整个科学得以运转的术语。

 

 

物理符号系统(Physical Symbol Systems ) 让我们回到符号这个主题,并定义一个物理符号系统。“物理的”这个形容词表示了两个重要特性:(1)这类系统清晰服从物理定律,它们能被由工程化组件生成的工程化系统所识别;(2)虽然说我们使用的术语“符号”预想了我们故意为之的解释,但它不限制在人的符号系统内。

一物理符号系统组成了一个实体集,即所谓的符号,这些符号是一些物理模式,可作为叫做表达式的另一种类型实体(或者说符号结构)的组件出现 。因此,一符号结构是由符号的若干以某种物理方式相联的实例(或记号 tokens)组成的(比如一个记号接着一个记号)。任何时刻该系统都会包含这些符号结构的一个聚集。除了这些结构以外,该系统也包含了一些对一表达式作操作从而生成其它表达式处理的聚集:生成,修改,复制以及销毁处理。一物理符号系统就是一台随时间而生成一个进化物理结构聚集的机器。较这些符号表达式而言,这种系统存在于更宽泛的对象世界上。

 

对符号及对象的结构而言,这个表达式有两个观念:指定(designation)和 解释(interpretation)。

 

 

指定(Designation)。如果给定该对象,系统即可影响该对象本身,也可依赖该对象的形式进行表现,那么一表达式会指定一个对象。

 

 

在两种情形下,通过该表达式来存取该对象就是可能的,这就是“指定”的本质。

 

 

解释(Interpretation)如果该表达式指定一个处理且如果给定该表达式,该系统就可以执行该处理,那么系统可以解释一个表达式。

 

 

所谓“解释”显示了一特定形式的依赖行为:给定一表达式系统就可执行给定的处理,就是说,系统可以唤起并执行来自指定表达式的自身处理。

 

一个能够进行指定和解释的系统在刚刚所显示的意义上还必需满足若干附加完备性、闭合需求,我们只简要提及这些;它们所有都重要并有深远影响。

 

  1.  一个符号可用作对无论什么任何表达式的指定来使用。就是说,给定一个符号,它不是可以指定何种表达式的“先验规定(prescribed a priori)”。这种任意性只对符号使用;符号标记和这些标记的互相关系决定了何种对象被一复杂表达式指定。
  2. 存在这样的表达式:它指定了机器能够为之的每个处理。
  3. 有以任意方式去生成任意表达式、修改任意表达式的处理。
  4. 表达式是稳定的;一旦生成了它们就会持续存在直到被显式的修改或舍弃。
  5. 系统可以把控的表达式的数量本质上是无限的。

 

 

我们刚定义的系统类型对计算机科学家并非不熟悉。该系统支持相似于所有通用计算机的一个大家族。如果一个类似于 LISP 这样的符号操纵语言被当作定义一个机器,那么这种家属关系就变得真实而亲切。我们所以描绘这样一个系统,意图不是要提出某个新玩意。情况恰恰相反:是为了显示什么是当前所知,及对满足这样一个刻画的系统之假设。

 

我们现在可以宣称一个概括的科学假设了,这是一个对符号系统而言的定性结构定律:

 

 

“物理符号系统”假说(The Physical Symbol System Hypothesis)。
一物理的符号系统对于一般智能行为而言,有充份必要意义。


我们说“必需”是指任何展示一般智能的系统将会在对一物理符号系统作分析基础上进行证明。我们说“充份”是指任何有足够大小的物理符号系统可进一步组织以展示一般智能。我们说“一般智能行为”是希望显示我们在人的行为中所看到的相同范围智能:在对系统终端是合适的任意真实环境行为中,以及在该环境的适应性需求可以某些限制速度和复杂性的方式出现中。

 

该物理符号系统假说很明显是定性结构定律。它指明了系统的一个一般种类,在其中你可以发现智能行为可以为之的身影。

 

 

这是一条经验主义假说。我们已经定义了一类系统;我们期望去问:哪个种类能对我们在现实世界中找到的现象集担负起责任。智能行为无所不在的环绕在我们的生物世界中,大多是在人的行为中。这是一种我们可以通过它是否由人来识别的行为形式。该假说可能彻头彻尾的错误。在任何系统都可以不容分辩的展示它的意义上而言,智能行为不这么容易就能产生。实际上,有些人的分析引领他们总结出,或在哲学基础或在科学基础上该假说是错误的。科学而言,你仅能通过产生关于自然世界的经验主义证据才可对其捍卫 。

 

 

我们现在就需要跟踪该假说的发展,并看看它的证据在哪里。

 

 

 

符号系统假说的发展(Development of the Symbol System Hypothesis)

物理符号系统是通用机的一个实例。因此该符号系统假说蕴含智能将会被一通用机识别。然而该假说远超出了常建立在物理决定论一般基础上的那种论据,即任意可被识别的计算可被通用机识别,如果那种任意计算详加说明(However,  the  hypothesis  goes far beyond the argument, often made on general grounds of physical determinism, that any computation that is realizable can be realized by a universal machine, provided that it is specified)。由于它特别宣称智能机器就是一个符号系统,因此就要制造关于智能系统本性的一个特定体系结构断言。重要的是去理解这种附加说明如何出现。

形式逻辑(Formal Logic)。该假说的源头追本溯源说起来回到了“FregeWhitehead 和 Russell ”之于形式逻辑的纲领:捕获逻辑中数学的基本概念性观念,并给出这些观念的证明,且在一个安全基础上进行推理。这种努力在我们所熟悉的命题、一阶和高阶逻辑数学逻辑中达到了巅峰。它发展出一种特有观点,常常被引申作“符号游戏(symbol  game)”逻辑。通过吸收所有数学运的算逻辑,正是通过某纯粹语法规则处理无意义标记来玩的一个游戏。所有意义都被整理过。某人有一种机制,就是关于各异事物可被证明的系统,虽然还允许斟酌(我们现在可以说是“非确定性的[nondeterministic]”)。因此进步就首先由以下作出的:远离所有看上去和意义及人的符号相关的东西。我们可称这为形式符号操纵阶段

这种一般看法在信息论发展中得到很好反应。已多次指出了 Shannon 已定义一个只对通讯和选择有用的系统,该系统对意义一无所知。给该领域信息论这样一个一般名字令人感到遗憾,试图再次将其命名为“选择性信息论(the theory of selectiveinformation)”当然是徒劳的。

图灵机以及数字计算机(Turing Machines and the Digital Computer)。第一台数字计算机以及自动机理论的进展是从图灵自己在 30 年代的工作开始的,它们就是一回事。第一台数字计算机和自动机理论两者观点在什么是本质这点上取得一致。让我们使用图灵自己的模型吧,因为它很好的实现了这些特性。

一台图灵机是由两个记忆组成的:一条无限的带子,一有限状态控制。该条带子把控数据,就是著名的零和一。这台机器有一个非常小的特有操作集合:在带子上的读、写、扫描操作。所谓读操作不是一个数据操作,而是对作为在该读头部下数据的一个函数的控制状态提供了条件转移。我们大家都知道这种模型包含了所有计算机在它们可以做什么方面的本质,虽然说其它有不同记忆和操作的计算机可能会以对空间和时间有不同需求的方式表现出相同计算。特别而言,一台图灵机的模型内在的包含了什么是不能够被计算的观念和可以执行任何可被任意机器所完成的计算机(通用机)这两种观念。

 

我们应当赞美就信息处理最有洞见的这两个在先于现代计算机成为现实的三十年代所产生的观念。这是天才的阿兰图灵的贡献。这也是同时代数学逻辑发展的贡献,也是计算机科学之于其责任深度的明证。和图灵工作同时出现的有逻辑学家 Emil Post 和 Alonzo Church 各自独立的工作。从之于逻辑系统的独立概念开始(各自提供了生产函数和递归函数)他们殊途同归的在不可判定性(undecidability)和一般性(universality)上得到了类似结果,这种结果很快就显示所有这三个系统是等价的。实际上,所有这些对定义最一般种类信息处理系统尝试的收敛都对我们这样的信念提供了一些助力:我们已经把握了在这些模型中作信息处理的本质。

 

表面上,没有一个系统有符号作为某种被指定东西的一个观念。数据被认为仅是零和一的字符串,那个被插入数据对物理过程计算的减小才是本质的。有限状态控制系统总被视为一个小控制器,并且执行逻辑游戏来查看在没有破坏该机器的一般性下一个状态系统可以多小。就我们所能说而言,没曾执行游戏以动态的把新状态增加到有限控制,把这个控制记忆想做把控大块系统知识。这个阶段达到的只是阐述原则的一半:证明可从一描述去运行机器。也就是说,这是在自动形式符号操纵阶段


存储程序概念(The Stored Program Concept)。

随着第二代电子计算机在40年代中期的发展(在 Eniac 之后),存储程序的概念诞生了。存储程序这个概念从观念和实践两者上来说,作为一个里程碑出现很是遇时。程序现在可以是数据也可以是作为数据的操作。这种能力当然已在图灵模型中显示出来:这种描述是对把那条带子作为数据而言的。不过,这个观念只有到机器获得足够内存以使得将实际程序定位到某些内部位置成为可能时才得到认识。话说回来,Eniac 只有 20个寄存器。

存储程序观念体现了解释原则的另一半,那一半是说系统自身数据可以得到解释。但它还没包含指定概念——在意义背后的物理联系。

 

 

 

列表处理(List Processing)。出现在 1956 年的下一步是表处理。数据结构的内容现在是从我们物理符号系统意义而言的符号了:指定的模式,其有参考对象。表有允许到其它表作存取的地址,这种观念就是所谓表结构。这是当同事问数据在哪里时我们给出的一种在列表处理早期就数次展示过新见解,就是说,何列表最终有了对作为系统内容的那些比特聚集。那些同事发现很奇怪的是,压根就没有这样的比特而只有指定其它符号结构的符号。

表处理类和计算机科学进展中的三件事是同时出现的。(1)正是一个真实动态内存结构在机器中的生成才使得迄今为止被认为有固定结构存在。除替换和变更内容的那些外,它还对我们全体构建和修改结构操作进行了添加。(2)它是对由数据类型集合及和这些数据类型合宜的相应操作集共同构成的一台计算机基本抽象的早期证明,从而一计算机系统应当使用任何对那些独立于其背后机器的应用来说是适宜的数据类型。(3)表处理产生了一指定模型,因此在我们今日计算机科学中使用这种概念意义上来定义符号操作。

由于经常发生,时代的实践已然在呼唤表处理的所有元素了:地址是明显的常用作取得存储,鼓机用来链接程序(所谓的一个接一个寻址)诸如此类。但表处理作为一个抽象观念已生成了一个新世界,在这个世界里塑造着的是指定动态符号结构。被植入早期表处理系统的语言(IPLLISP)常被描述为对通过编程实践的表处理技术的散布而言是一个障碍;但正是这种工具才把抽象连接到一起。

LISP.  值得关注的一步:McCarthy 在 1959-60 年创造的 LISP [McCarthy, 1960 ]。它完成了抽象这一幕,将列表结构从它们被嵌入的具体机器中挖掘出来,生成一个有“S 表达式(S-expressions)”的新规范系统,该系统可用来显示对其它计算通用模式的等价性。

 

结论(Conclusion)。指定系统观念和符号操作在50年代中期之前没有出现并不意味更早先步骤并非无关紧要或不重要。整个概念是这些东西的连结:可计算性、物理可实现性(通过多重技术)、普遍性、代表处理的符号(即可解释性 ),以及符号结构和指定。每一个步骤都对整体提供了不可或缺的重要部分。

这个链条中的第一步是由图灵完成的,即理论动机。但其它所有却都有一个经验主义来源。我们被计算机自身进化所导引。存储程序原则是从 Eniac 的经验中得出。列表处理是从试图构建智能程序中得出。正是从来自随机存取内存中的线索提供了对指定符号的一个清晰物理认识。LISP是从随表处理进化的经验中出现的。

 

 

证据(The Evidence)

我们现在就来到对“物理符号系统能够有智力行为,以及一般智能行为对物理符号系统的要求”假说的证据,该假说是一种经验主义一般概括而非一个理论。我们对解释符号系统和基于纯逻辑背景的智能间的联系方式一无所知。我们必需看看这样一种解释匮乏的事实是为什么。虽然我们中心目标不是详细回顾证据,而是要使用我们之前的这个例子以显示计算机科学是经验主义探究的范围命题。因此,我们只会显示那里有何种证据以及测试过程的一般性质。

物理符号系统这个概念取得本质如今的形式是在1950年代中期,你也可以把从那时起当作计算机科学的一个连贯一致子领域 —— 人工智能增长的开始。从那时以后 20 年的工作中可以看到连续经验证据积累,主要是两类。第一类致力于能产生智能的物理符号系统的充分性,试图构建和测试有这样一种能力的特定系统。第二类证据致力于在无论何时表现出智能时有一个物理符号系统的必要性。 经验证据的积累最一开始来自我们最熟悉的智能系统 —— 人 —— 并试图发现他的认知行动是否能被解释为一个物理符号系统的工作。我们会稍后作简述有其它形式证据,但这两个是重要的。我们将会轮流考虑它们。第一个通常被称为人工智能,第二个是认知心理学的研究范畴。


构建智能系统(Constructing Intelligent Systems)。之于疾病的细菌理论最初测试的基本范式是:先识别出一疾病,然后去寻找它的细菌。类似范式激发了人工智能中许多研究:识别出要求智能的一个任务域,然后对一个可控制那个域的数字计算机去构建一个程序。最先看容易和良构的那些任务:迷语和游戏,排产和定位资源的操作查询问题,简单归纳任务。如果不是数百,也有几十个这样的程序现在被构建起来,每个都能在合适领域中对智能行为进行衡量。

智能当然不是一个全或无的问题(an all-or-none matter),而且在特定领域中持续向更高级别性能迈进之实,朝向开拓这些领域更广范围也是事实。比方说,早期象棋程序被认为是成功的,如果那些程序可以带一些目的指示去合法执行游戏;稍后,那些程序就达到人的初学者水平;不到 10 或 15 年,那些程序就可以和认真的业余选手比试比试了。进展是缓慢(对程序努力上的投资是很小的)但却持续处于构建及测试范式的规律周期中,该周期是:在许多AI 程序的基本生成与测试周期的宏观层面上模仿整个研究活动。

存在这么一个稳定广大范围,在其中智能行为是可以达到的。来自最初任务,研究已经扩展到构建可以不同方式去把控和理解自然语言的系统、,解释视觉场景系统、手眼协调系统、设计和书写计算机程序系统、语言理解系统,这个担子如果不是没有尽头也相当长。如果对我们有超越假说而不能执行的限制,那些限制现在还看不出来。到目前为止,进展的速度主要受以下的控制:相当适量的已应用科学资源,用于各个新的主要任务的大量系统构建努力的不可避免的需求。

 

 

许多已经在前行,当然,不是适应特定任务领域的智能系统例子的一个简单堆砌 。如果结果表明人工智能的程序执行这些各异任务(从它们都是物理符号系统的实例角度说)没有什么共同点,那就是令人惊讶且没有吸引力的。因此,在找寻有通用性机制方面有极大兴趣,在找寻介于程序执行各异任务时的常用组件方面亦如此。这种找寻就在对最初符号系统假说的理论之外出现了对人工智能中有力的特殊种类符号系统而言一个更加完善的刻画。在本文献第二部分,我们将会在启发式搜索假说的第二层特性上讨论一个假说的例子 。

 

对通用性的追寻引出一系列设计用来区分通用问题的程序,所谓通用问题是从特定任务域需求来的解决机制。通用问题解决器(General Problem Solver ,GPS)很可能是这些中的第一个;其众多同时代后继者中有诸如 PLANNER 和 CONNIVER。对通用组件的探寻已引导出对以下东西的概括方案:目标和规划的描述,构造判定网络的方法,控制树查询模式匹配机制及语言解析系统的过程 。实验目前已在找寻方便设备以表达时间序列,时态,运动,因果性,诸如此类。越来越多,那么从这样的基本组件起以模块化方式组装起大型智能系统就是可能的。

 

关于通过一而再再而三的调试接下来将会是什么,我们可以取得一些和细菌理论类似远景。如果受到主要存在于找寻和各疾病相伴细菌理论激发的研究产生了第一次爆发,其后的努力就会向疾病细菌理论一样(之后的努力就转向了学习什么是细菌),去建立在基本定性定律上的一个新结构。在人工智能中对准构建智能程序的广泛各异几乎随意选择任务活动之第一次爆发让路给更紧急定向的研究任务:理解这种系统的通用机制。

 

 


人的符号行为建模(The Modeling of Human Symbolic Behavior)。符号系统假说显示人的符号行的出现是因为他有一个物理符号系统特征。因此,对人的行为用符号系统建模努力的结果就成为该假说证据的重要部分,而且人工智能中研究和信息处理心理学研究走的很近,正如它常常被提起。

 

对以符号系统术语来表示人的智能行为解释的寻求在过去20年中相当普遍; 存在于信息处理理论引领认知心理学的当代观点中。特别是在问题求解,概念获得,以及长期记忆领域及如今统摄了该领域的符号操纵模型。

 

信息处理心理学的研究涉及两类主要经验活动。第一类经验活动是在需要智能的人的行为任务的观察和实验指导下。第二类经验活动和人工智能中并行的活动非常类似,即对符号系统编程以模拟观察到的人之行为。心理观察和实验导致关于在使用的主题的符号处理假说的公式化,而且这些符号处理是深入程序结构中的观念之重要来源。如此说来,GPS 的基本机制的许多观念源自对这种东西的仔细分析: 当在执行一问题解决任务时深入思考人对象的产出”。

 

计算机科学的经验刻画并不在什么地方对心理学同盟有更多证据。不仅心理学实验需要去测试模拟模型表现人类行为时的真实性,而且从这个实验中得出之于设计和构建物理符号系统的新观念。


 

其它证据(Other Evidence)。我们没有考虑符号系统假说的证据主体是一个负面证据:关于智能行为可能是如何完成的(无论对人或者机器来说)特定竞争假说的缺失。构建这种假说的大多数努力发生在心理学领域中。这里我们有从通常标记为行为主义观点到那些通常被标记为格式塔理论观点的一连续理论。这些观点都不能成为符号系统假说的对手,这样说基于两点。首先,行为主义亦或格式塔理论都没证明,甚至没显示如何去证明:它的假定解释机制足以解说复杂任务中表现的智能行为。其二,两种理论都没有像人工程序说明中的任何公式化。作为一种事实,代替理论是如此含混不明以至给那些理论以信息处理解释不很困难,从而可将它们同化到符号系统假说中来。

 

结论(Conclusion)

我们试图使用物理符号系统假说去实实在在的揭示,计算机科学是一种以下术语意义上的科学管理:该术语发展了科学假说,然后寻求通过经验主义探究来验证。之所以选取这个特殊例子去阐明我们的观点,我们还有第二个理由。物理符号系统假说本身就是一种实质性的科学假说,即我们先前所说的那类定性结构定律。该假说代表了计算机科学的一个重要发现,如果它体现于经验证据,实际就显现了其出现,那就会对该领域造成持续重要影响。

 

现在我们转向第二个例子,在智能中查询的角色。这个主题及关于它我们将验证的特定假说同样(总体而言)也在计算机科学中扮演了一个核心角色,特别而言在人工智能中扮演了核心角色。

 


II. 启发式搜索(Heuristic Search)

知道物理符号系统可对智能行为提供模型(the matrix)并不意味告诉我们那些智能符号系统是如何达到这一点的。我们关于计算机科学中性质结构定律的第二个例子对智能系统如何达到这一点作出回应,宣称符号系统通过使用启发式搜索过程解决问题。这种概括(一如先前)建立在经验证据上而非从其它什么假设导出的形式。然而,过会我们就将看到它确实和符号系统假说有某种逻辑联系,而且可能我们要期待在未来的什么时候对这种联系作出形式化。直到那时来临,我们的讲述必需再次是一个关于经验主义探究的故事。我们必须描述关于启发式搜索所知为何,并回顾一下经验主义查询,显示它是如何让行为成为智能的。我们以性质结果定律的陈述来开始,就是启发式搜索假说(Heuristic Search Hypothesis)。

 

启发式搜索假说(Heuristic Search Hypothesis)。问题的解决被表达为符号结构。物理符号系统在问题求解中通过搜索来施展智能,就是说,通过形成及渐进修改符号系统直至其生成一个解决结构。

 

物理符号系统必须使用启发式搜索解决问题,因为这种系统有受限处理源;在一个有限步骤及一个有限时间段中,它们仅可执行有限数量处理。当然那不是一个非常强的限制,因为所有的通用图灵机都诟病于此。然而我们所期望的这种限制是在一个更强意义上而言的:我们指实际上有限。我们可以想象那种不受实际方式限制的但是所有可行的系统,比方说,以一个恒定速率对深度方向每个下层单元去并行搜索一棵以指数扩展的树节点。我们这里不会去关心那样的系统,而是去关心这样的某些系统:就某些系统所遭遇到的情形之复杂性而言,计算资源是相对稀缺。限制不会将任何在计算机中或在处于真实任务环境里的人中的真实符号系统排除在外。资源受限的事实允许我们(对大多数目的而言)将一个符号系统看作好像是一个序列化的、一次一个处理的设备。如果它可在任何短时间期内完成处理的一小部分,那我们就可把该符号系统当作“一次执行一件事”。因此,有限符号系统(limited resource symbol system)和串行符号系统(serial symbol system)实际上是同义的。随时而变(from moment to moment )的相对稀缺资源定位问题(若这个时[moment]非常短)就可被经常当作是串行机排产问题。

 


问题求解(Problem Solving)

由于解决问题能力通常作为一系统是否有智能的首要表现,人工智能的大多数历史自然是热衷于试图构建和理解问题求解系统(problem-solving systems)。问题求解这个问题已被哲学家和心理学家在神秘意义的浓厚论述中讨论了两个千年。如果你认为关于一个符号符号系统求解问题没有什么不确定或者不可思议,那么你就是今日的一个孩童,观点在中世纪就已经定型了。柏拉图(还有以他之口所描述的那个苏格拉底)发现,要了解这样的问题是很困难的:即便可多么娱人的那些问题,大多仍不可解决的。让我给你提个醒,他在美诺篇(the Meno)中是如何给出迷语的:

 

美诺:苏格拉底,你将如何深入那些你不晓得的东西里作探究呢?你将提出什么当作探寻主题呢?如果你发现你想要的是什么,你怎么才能知道这是你所不知道的?

 

为了因对这个迷语,柏拉图发明出他著名的回忆理论:当你以为在发现或学习某些东西时,你实际只是在回忆起你在前世所知道的东西。如果你觉得这种解释很荒唐,今天有一个简单多的可行解释 —— 基于我们对符号系统的理解。一个大略如此的陈述如下:

 

陈述一个问题就是指定(1)对符号结构(该问题解决方案)一个种类的一次测试,以及(2)符号结构的一个生成程序(潜在的解决方案)。解决一个问题就是 使用(2)生成一个结构去满足(1)的测试。

 

如果我们知道我们想做什么 (测试) 且如果我们不能马上知道怎样去执行它(我们的生成程序不是马上生成能满足该测试的一个符号系统),那我们就有一个问题。一个符号系统可以陈述及解决问题(有时候),这是因为该符号系统是可以生成并测试的。

 

如果那就是关于问题求解的全部,为何不简单的立即去生成一个能满足那个测试的表达式呢?这实际上是当我们期望和梦想时我们在做的。愿望是一回事,事实又是一回事。不过在梦想世界外它是不可能的。知道我们将怎样测试一些构建起来的东西并不意味我们知道如何把这个东西构建起来,我们有任何生成器去这样做构建。

 

比如,众所周知在玩竞赛性国际象棋时“解决”问题意味什么。一个简单测试存在于对获胜位置的关注、对把敌方国王将死的测试中。在梦想世界中,你只要生成一个能导致将死所有对方相应策略的策略。唉,已知的现存系统(人或机器)中没有生成器会这样做。取而代之的是,一着好棋是由生成各异的选择寻找的,并使用了近似并通常不正确的“被期望显示一个特定路线棋谱走在通向胜利位置的路上的那种可能性”权衡去费力评估这些选择。


有走棋生成器;必胜走棋生成器还没有。

 

在可以有针对一问题的走棋生成器之前,还必需有一个问题空间:包括最初和目标局面就身在其中这样问题的局面得以表示的一个符号结构空间。走棋生成器是关于修改问题空间中的一个情况到另一个情形的过程。物理符号系统的基本特征保证它们可表示问题空间且它们处理走棋生成器。然而,在任何具体情况下(那些物理符号系统对一个问题空间作合成并把生成器移动到那个局面)的人工智能的研究中还非常前沿。

 

当任务被用一个问题和一个问题空间表达时,一个符号系统要面对的任务就是运用它的受限处理资源去生成可能解决方案,一个接着一个直到找出一个能够满足问题定义测试(problem-defining test)的方案。如果系统对其中潜在解决方案被生成序列还有些控制,后面的期望就会是对这种生成序列进行排列,从而实际解决方案有很高可能更早表现出来。一个符号系统会在成功执行范围所及的这点中表现出智能。一个有限处理资源智能存在于对下一步作何的明智选择中。


 

问题求解中的搜索(Search in Problem Solving)

在约莫人工智能研究的第一个十年,对问题求解的研究几乎和对搜索处理的研究是同义的。从我们对问题和问题求解的描述中很容易看出为何如此说。实际上,它可能被问到是否可以是其它的。不过在我们试图回答这个问题前,我们还必需对在时间活动中进行自我显示的搜索处理本性有进一步认识。

 

从问题空间中萃取信息(Extracting Information from the Problem Space)。考虑一符号系统集合,某些小的子集是给定问题的解决方案。进一步假设,解决方案随机分布在整个集合中。如此,我们就是指没有这样的存在:使任何搜索生成器能较一随机搜索更好执行信息 。然后较之在解决问题中任何其它什么方式,没有符号系统可能展现出更多的智能(或更少的智能)。

 

其后表现出智能的一个条件就是:解决方案的分布不完全随机,符号结构空间至少在某种程度上表现出度和模式。第二个条件就是:在符号结构空间里那种模式或多或少可以察觉。第三个条件就是:潜在解决方案生成器可基于它发现何种模式而表现出区别。在问题空间中一定存在信息,并且符号系统必须能够对信息作萃取和使用。让我们先看其中智能很容易出现的一个非常简单的例子。

 

来考虑解决一简单代数恒等式问题:

 

AX+B=C X +D 

 

测试定义了一个解来作为 X = E 形式的任何表达式 ,诸如  AX+B=C X +D 。现在可将其用作这种过程的生成器:产生任何后来由代入后一等式进行测试的数字。我们不会把这个叫做是一个智能生成器。

 

作为一种选择,你可以使用这样的生成器而不改变它的解:利用最初等式可被修改这样的事实(通过在两边加或减同样量或在两边乘或除同样量)。不过当然,我们甚至可以获取更多信息,从而通过比较带解决方案形式的最初表达式去指导该生成器,并在将其代入期望的形式同时,使保留解决方案不变的等式的那些变化精确。这样的生成器将会注意在最初等式右手边有一个不期望的 CX,从两边减去它并再次收集项。然后就会发现在左手边有一个不期望的 B 并减去它。最后,就可以通过除法删减去不期望的在左手边的那个系数(A - C)。

 

因此通过此种过程,它现在展现出值得考虑的智能,生成器产出了连续符号结构,每一个都通过前一个修改来获取;且这种修改关注的是减小介于输入结构形式及测试表达式形式间的差异,与此同时,为一解维持其它条件不变。

 

这个简单例子已揭示用于智能问题求解的符号系统主要机制的许多要点。首先,每个连续表达式不独立生成,而是通过修改先前产生的那个而生成。其二,这些修改不偶然而是基于两种信息。那些修改基于在这整个代数问题类上恒定的信息,而且彼信息构建到生成器自的结构中:所有对表达式的修改必需不对公式解决方案作变更。那些信息同样依赖于在每一个步骤变更的信息:查得保留在当前表达式和期望表达式形式间的不同。实际上,生成器包含的一些解必需满足测试,从而不符合这些测试的表达式将不再被生成。使用这第一种信息就保证所有可能表达式中仅一小点子集实际上会被生成,而不会担心从这个子集中失去解表达式。使用第二种信息通过使用以指导搜索方向的简单形式结果链分析(means-ends analysis)的一连串近似得出期望解。

 

在引导搜索信息中没什么好神秘的。 我们无需跟随柏拉图对已经知道解的符号系统赋予一个前世。一个适度精致的生成器/测试系统无需唤起转世轮回之说就能够玩这个把戏。

 


查询树(Search Trees)

这个简单代数问题可能看上去个不寻常,甚至关于查询例子是有点病态。可以肯定它不是试错查询,因为尽管有少数尝试,但没错误。我们更习惯将问题求解搜索想作,在它们导出一个解之前形成这样的一棵树:有部分解决方案之可能性会增长到千计甚或百万计的有繁茂分支的一颗树。


因此说,如果从它产生的每个表达式中生成器生成了 B 个新分支,其后这棵树将会增长为 B D,其中 D 是其深度。为此代数问题而增长的这棵树有这种特性:其分支性 B 是一致的。

 

执行国际象棋的程序典型走的是广度搜索树的增长路子,在某些例子中总计可以有百万分支甚至更多。(尽管这个例子可以说明我们关于树搜索的观点,我们还是应当注意,在国际象棋中搜索的目的不是生成计划的解而是要评估[测试] 这些解决方案)。一种对游戏程序的研究已完全关注提升国际象棋棋盘的表示以及对在棋盘上移动的处理,从而可以加速研究和使得查询更大树成为可能。这种方向道理当然在于,随动态搜索越来越深最终评估也应当越来越精确。从另一方面来讲(有很好经验证据)最强的人玩家,国际象棋大师很少对一棵有百计的分支进行探索。所以做成这种事业更多不是通过较国际象棋游戏程序而言更浅的搜索,而是通过非常稀疏的作分支及在每个节点有所选择进行的。这仅可通过将更多选择构建到生成器自身中成为可能而不会引发评估的退化,从而生成器能够为以下作出选择:仅是其分支非常可能导致关于位置的重要相关信息形成的那些。

 

某种程度上似是而非,探测这个讨论会导致(潜在解决方案结构的连续形成)一个符号系统的智能问题求解练习的基础方面但搜索量不是智能量的表示。让一个问题成为一个问题不在于对这个问题的解决必需要大量搜索,而在于如果智能不可少的级别没有被应用就需要大量搜索。当符号系统尽力解决一个对做啥知之甚多问题时,该符号系统简单而直接迈向其目标;不过当其在知之甚少的任何时候,当其进入未知领域,该符号系统就要面对再次发现路前要作出大量搜索的威胁。

 

在各形成问题解计划中的搜索树的指数爆发式出现潜在警告我们,不要依赖于计算机蛮力搜索--即便最快和最大计算机,作为对忽视及不选择它们的生成器的一种补偿。可以有足够快的计算机、编程使得其足够聪明、通过蛮力搜索下得一手好棋,这种希望还是周期性的会在某些人的脑袋瓜里出现。关于国际象棋的理论中还没发现这种法外之规。 在管理仅有适度结果大小相当的树搜索上的经验研究,使这种搜索较以前当国际象棋棋子被第一次选择作为人工智能的一个合宜任务时成为一种方向变小的可能性。我们必需把这看作对研究国际象棋程序的一种重要的经验发现。

 

智能的形式(The Forms of Intelligence)

经此以后,智能的任务就是去避免挥之不去的来自搜索的指数式爆炸威胁。那么这怎么可得以完成呢?第一个路线已被代数例子和仅生成为未来分析起见而“可行”移动的国际象棋程序所揭示出来,该路线被选择性的构建到生成器中:仅形成似有成为希望解的结构或沿这条路线可能达到解的结构。这样做通常伴随而来的就是降低分支速率,而非完全阻止分支形成。最终指数爆炸不可避免 -- 比如对那个代数例子的特殊高度结构化情形而言,仅是延迟而已。因此,一个智能系统一般需要对这样一种东西进行补充:它的解生成器的选择性和其它指导搜索的信息使用技术

20年在不同任务环境中管理树搜索的经验产生了一套小的通用技术,这套技术今日人工智能中每一个研究者设备的一部分。由于这些技术已经被像 Nilsson [1971] 这样的一般工作中描述过,所以它们可以简洁的在这里总结一下。

 

在序列化启发式搜索中的基本问题经常是:下一步该做什么?在树搜索中,这个问题被转变为两个组成部分:(1)我们从这棵树中的何节点开始搜索,以及(2)我们应该从那个节点的什么方向开始搜索?对回答第一个问题有助益的信息可能被解释为:衡量不同节点针对目标的相对距离。最佳优先搜索(Best-first search)要求自显示最接近目标节点后的下一个节点搜索。对回答第二个问题有助益的信息“什么方向作搜索”,就如在那个代数例子中,常是通过这样而得到的:侦测介于当前节结构和由解测试所描绘目标结构间的详细差异,以及对减少这些特定种类差异的相关选择行为的选择。这种技术就是所谓的“手段目的分析(means-endsanalysis)”,这在通用问题求解器的结构中扮演关键角色。

 

经验研究作为人工智能研究中的一种通用观念的重要性可由追溯通过大量问题求解程序历史而得到清晰印证,这些中的两个核心观念是:最佳优先搜索和手段目的分析。最佳优先搜索初步已经在1955年由逻辑理论家呈现出来,虽还未命名。体现手段目的分析的通用问题求解器在大概1957年出现,但是混合了修改过的深度优先搜索而非最佳优先搜索。国际象棋程序通常由于经济原因而和深度优先搜索(depth-first search)相结合,这是大约 1958 年后由有力的字母修剪过程(alpha beta pruning procedure)作出的一种补充。这些技术每个都表现出重新发明好几次,并且直至 1960 年代中期前还很难发现这样的理论探讨:通用的、独立于任务的、对这些概念话语下的问题求解的理论探讨。它们有数学理论帮助而有正规支持量还只是个开头:某些关于能从使用字母启发式(the alpha-beta heuristic)去减少搜索的理论,一部分关于最短路径查询(shortest-path search)理论(Nilsson [1971]对此作出评价),一些非常近期的理论关注用一概率评估函数的最佳优先搜索。

 

“弱”与“强”方法("Weak" and "Strong" Methods)。我们已讨论的技术更多专注于对指数爆炸的控制,而不是对其阻止。出于这个原因,这些技术被适当的称之为弱方法(weak methods),即当实际包含在问题空间符号系统的知识或结构量不足以允许避免全面搜索时的那些方法。把高度结构化情况(就是说,其可以公式化)就像一个线性编程问题一样去和一个不那么有结构化的组合问题情况,类似旅行商问题(traveling salesman problem )或排产问题(scheduling problems),做个比较是很有意义的。(“不那么有结构的”这里指对于问题空间结构的相关理论不充分或不存在)。

 

在解决线性编程问题中可能需要大量计算,不过其中搜索不会出现分支。每一步都前进在解决方案的康庄大道上。在解决组合问题或是证明定理中很少可避免树搜索,且成功取决于我们所描述过的排序之启发式搜索方法。

 

并非所有人工智能问题/解决研究的路线都跟随我们概括出来的路径。一个有些不同点的例子是在定理证明系统中给出的。这里,从数学和逻辑引进的观念对探究方向有巨大影响。比方说,当完备性不可被证明时对启发式的使用就受到抵制(这有点讽刺,因为大多数有趣的数学系统被认为不可判定的)。由于很少可证明最佳优先搜索启发式的完备,或者很少可证明许多类型的选择生成器的完备,故需求这种对完备效应就非常有碍了。当定理证明程序由于它们在搜索树中的组合爆炸而继续丧失能力时,思考就开始关注选择性启发法,这种方法在许多案例中被证明,和被使用在通用问题求解程序中的启发法是类似的。比方说,支持集启发法就是一种逆向工作形式,适应于定理证明环境下的解。

 

经验总结 (A Summary of the Experience).我们现在已描述了我们的第二定性结构定理工作,它宣称物理符号系统是从启发式搜索意义上解决问题的。在那之外我们已检查了启发式搜索的一些辅助特性,特别要说一点,该启发式搜索经常要面对搜索树的指数爆炸及用来避免这种威胁而使用的一些手段。对于启发式搜索已作为问题求解机制在多少程度上是有效的诸观点有不同,这些观点基于任务领域被视为的东西及采用何种充分性判据。放低要求或者对失败作出充份估计就容易取得成功。证据可以总结如下。很少有程序会在“专家”这种专业级别上解决问题。Samuel 的检验员程序和 Feigenbaum 与Lederberg 的 DENDRAL 可能是最有名的例外,不过某人也可以指出对类似操作研究问题域而言作为排产和整合程序的一系列启发式搜索程序。在一系列领域中,程序在相当于业余水准上执行:国际象棋,某些定理证明领域,许多种的游戏和迷语。有复合知觉的“前端(front end)”程序还没有靠近人类的水平:视觉场景识别器,语音理解,可在真实时空中派用场的机器人。话虽如此,但已取得感人的进步,有一大部分经验汇聚到这些困难的任务中来。

 

我们还没有关于这些浮现出来的特定模式行为的深刻理论假设。不过,在经验基础上我们还是可以给出两个结论。第一个结论来自人类专家的类似国际象棋任务的行为中学习所得,似乎任何能匹配那种行为的系统必会在其内存中获取非常大的语义信息存储。第二个结论,大量带人监控的知觉组件任务的某些部分可归因于人眼和耳的特殊用途的内建并行处理结构。

 

在任何例子中,性能的质量必需要依赖于问题域及用于处理这些问题域的符号系统这两者的特性。对大多数我们感兴趣的现实领域而言,该领域结构并没有充份简单的证明(到目前为止)关于复杂性理论的产生,或以不同于经验的方式告诉我们,真实世界的问题在多大程度上和我们的符号系统解决这些问题有关。那种情况可能会改变,但直到改变前我们必需依赖于经验探索,使用我们知道的如何去构建最好问题解决器来作为关问题困难的量级和特征知识的一个主要来源。即使在高度结构化的类似线性编程领域,在强化处在大多数有力解决方案算法背后的启发法上的理论,较之对提供一深入复杂性分析更有用。

 


没有太多搜索的智能(Intelligence Without Much Search)

我们对智能的分析相当于,用提取和使用关于那个问题空间结构信息使那个问题的解可又快又直接的形成。发展符号系统问题解决能力的新方向然后相当于提取并使用信息的新方式。至少有三种类似的路线可以识别。

 

信息的非本地使用(Nonlocal Use of Information) 首先,好几个研究者都关注,在树搜索期间收集到的信息通常仅本地使用以帮助在信息得到汇聚的特定节点作出决策。一步棋的信息是通过动态分析一棵延展子树得到的,这种信息通常仅用来估计那个位置而不是估计可能包含许多相同特性的其它位置。因此,这种相同事实必须在搜索树上的不同节点中被反复再发现。简单的从信息浮现出的上下文中取出并使用它并不解决该问题,因为信息可能是仅在一范围受限上下文中才可能有效。最近几年,少数探索性努力已将信息从其最初的上下文转换到其它相关上下文中。虽然对这种观念的评论甚或下定论还为时过早,不过它已经显出了相当的希望。 Berliner [1975] 所追求的一条重要调查就是使用因果分析去决定一特定片的信息有效范围。所以如果一步有劣势的棋可以被追溯回作出它的那个移动,那么在从相同那个移动中衍生出的其它位置中就也可以想象。

 

所谓“风闻HEARSAY )”语音理解系统已采取另一种方式使信息全局可得,那个系统通过在多个不同级别作并行搜索寻求识别语音字符串 :音素,词汇,语法及语义。由于这些搜索全提供并评估了启发式,就它所获得的信息提供给一常用的可被所有源读取的黑板(blackboard)。此共享信息可被使用来剪除假定(hypotheses),甚至所有种类假定,否则就可能被某一个处理搜索到。因此,增加我们对使用非本地树搜索信息的能力对提升问题解决系统的智能提供了希望。

 

语义识别系统(Semantic Recognition Systems)。对提升智能的另一个积极可能性是给符号系统装上关于它在处理的任务领的丰富语义信息。比如说,对国际象棋大师的技巧经验研究显示,大师的主要技巧源是:能使他识别出一个棋盘上大量特定特性与特性模式的存储信息(关于它在应对任务域时的丰富语义信息及使用这种识别以建议对识别出的特性合宜的行动的一个信息)。这种一般观念当然已在一开始就融入国际象棋程序中。新东西是对这种模式的数量和相关大师级别玩家可能存储信息的识别:从这样的规模可能是5万。

 

所以将搜索识别为代替的可能性会上升,因为一特定且特别少见的模式可能包括巨量信息,前提是该模式紧密相关于问题结构的空间。当结构不规则且不能用简单数学描述概括时,那么大量相关模式的知识就可能是解开智能行为的那把钥匙。这是否在任何特定任务域如此更多可由实证调查来界定的问题而非理论界定。我们对被极大赋予语义信息和模式识别能力的符号系统的经验还非常有限。

 

以上讨论特别涉相关一识别系统的语义信息。当然,也有人工智能中整整一大片对语义信息的研究,语义记忆的组织已经超出我们这篇文章要论述的主题了。

 

选择适当的表述(Selecting Appropriate Representations)第三种调查的方式关注的是可能性:搜索可被减低或通过选择一个适宜的问题空间而避免的那种可能性。一个戏剧性揭示这种可能性的标准问题就是,不完整棋盘覆盖问题(mutilated checkerboard problem)。一个标准的 64方格棋盘可以被精确的用32块瓷砖覆盖,每一块是恰好覆盖两个格子的 1×2 矩形。现在假定说我们去掉棋盘对角上了两个格子,剩下的就是62个格子。这种不完整的棋盘可以精确的用31块瓷砖覆盖么?有无比耐话,作出这种覆盖的不可能性可通过试所有排布表现出来。另一种选择(就其它没这么多耐心者而言)更加智能,就是观察到棋盘的两个对角格子是同一种颜色。因此,相对其它仅有一种颜色而言的不完整棋盘少了两个格子。但每个瓷砖覆盖一种颜色的一个格子和另一种颜色的一个格子,并且瓷砖的任意集必定叫每种颜色覆盖相同数量的格子。因此这是无解的。 相对于通过搜索所有可能覆盖去徒劳的尝试解决该问题而言,一个符号系统如何可能去发现各个简单归纳证据呢?我们认为一个发现解的系统有较高水准智能。

 

不过可能在应对这个问题时,我们还没能脱开搜索处理。我们已经简单的将来自一个可能问题解决方案空间的搜索放到了一个可能空间的表述。从一种表述移到另一种表述的这整个过程以及对评估的发现和问题求解研究领域估计,对任何事件来说大体还是未知领域。统摄表达的定性结构定律还有待发现。对这些定律的找寻几乎可以肯定在未来10年中会得到大量的关注。

 


结论 (Conclusion)

这是我们关于符号系统和智能的一种解释。从柏拉图的《美诺篇》到现在走了一段很长的路,不过可能令人鼓舞的是,在这条路上的大多数进步是自从进入二十世纪后作出的,这之中的一大部分是本世纪中叶以后作出的。直到现代形式逻辑把它解释作对形式符号的操纵前,思想还完全是无形且难以言喻的。直到计算机告诉我们符号如何得以被机器处理前,它看上去仍主要待在柏拉图的理念天堂中或同样晦涩的人脑空间中。今天早上我们所纪念的人 —— 阿兰.图灵 —— 在世纪中叶的这些引导现代逻辑到计算机发展的十字路口作出了他的伟大贡献。


 

物理符号系统(Physical Symbol Systems)。逻辑和计算机的研究对我们揭示,智能存在于物理符号系统中。

 

符号系统是对模式和处理的收集,后者可产生、销毁且修改前者。模式的最主要属性在于,这些属性可指定对象、处理或者其它模式,并且当它们指定处理时,它们可被作出解释。所谓“解释”意味执行指定的处理。我们所熟悉的两个最显著种类的符号系统是人和计算机。

 

我们目前对符号系统的理解(通过一系列如早先所示的步骤)处于增长中。形式逻辑使我们依照句法对待熟悉了符号思想的原始材料及通过仔细定义形式化处理操纵符号的那些观念。图灵机使符号语法处理完全就是机器一样,并肯定了严格定义符号系统的潜在普遍性。计算机存储程序观念再次肯定符号的解释能力,这种能力已在图灵机中有所暗示。表处理将符号指称能力带向前沿,而且表处理把符号处理定义作允许独立于背后物理机器的固定结构。到 1956 年所有这些概念及实现它们的硬件都已经存在。对符号系统的智能研究,对人工智能的研究可以开始了。

 

启发式搜索(Heuristic Search)。人工智能的第二个定性结构定律说:符号系统通过形成潜在的解并测试它们、就是说搜索潜在解去解决问题 。解通常被认为通过生成符号表达式及连续修改它们直到它们满足一解的条件为止。因此,符号系统通过搜索来解决问题。既然符号系统资源有限,那么搜索不可能一次就得到实现而必须是串行的。留在其背后的就是一条从起始点到目标的独一路径,或者如果修正和备份需要,留在其背后的就是一整棵有类似路径的树。

 

符号系统被纯粹的混沌所困时是不可能表现出智能的。符号系统通过这样来执行智能的:从一问题域提取信息并使用提取出的信息指导符号系统的搜索,避免错误的转向和小路绕行。问题域必需包含信息,就是说,对工作方法要有一定程度的结构和秩序。美诺的悖论通过这样的观察得到了解决:信息可以被记住,但新信息也可能从指定符号的域中作出提取。在两种情形下,信息最终来源是任务域。

 

经验基础(The Empirical Base)。人工智能的研究关注:符号系统必需怎样组织从而表现出智能。这个领域中二十年的工作已积累大量知识体,足够写好几本书(事实也是如此),这些知识大多数有关这样的非常实在的经验形式:特殊种类的符号系统在特定任务领域中的行为。当然,从这种经验而来同样也出现一些总结:穿过任务域和系统,关于智能的一般特性及实现方式的总结。

 

我们试着在今天早上对这些概括中的一些作了陈述。它们大多定性而非数学式的。它们更多是地理学或进化生物学品位,而非理论物理学品位。它们足够强大以使我们今天能对相当范围内的任务域设计构建出适度智能系统 ,同时可以对这种东西获取非常深刻的理解:人类智能如何在许多情形下工作。

 


来者为何?(What Next)

在我们今天的讲述中,我们提到了开放式问题同时也放了一种答案;还有许多种。我们看到在过去四分之一世纪中围绕这个领域的令人振奋探索没有降温。两个资源限制会决定下一个类似时期的进展速度。一个就是可得的运算容量。第二个也可能是最重要的就是,有才能的、会被这个领域研究吸引而作为他/她们应对主要挑战的年轻计算机科学家数量。

 

阿兰图灵在他著名的文章《计算机器和智能》中总结到:

 

我们只可以看到前面一点距离远,但是我们可以看到那里有许多需要做的。”

 

图灵在 1950 年看到的许多需要处理的事情已经得到了处理,但是议程还一如从前一般满。可能我们涉及他上面的简单陈述太深了,不过我们喜欢去想想其中图灵识别出所有计算机科学家本能所晓得的基本事实。对所有当我们命定将要在问题环境中连续搜索时的物理符号系统而言,辛辣的问题总是:来者为何?

 

 

索引(References)

Berliner, H. [1975]. 

作为问题求解的国际象棋:一种策略分析器的发展 

Chess as problem solving: the development of a tactics analyzer

Ph.D. Th., Computer Sci. Dep., Carnegie-Mellon U. (unpublished).

McCarthy, J. [1960]. 

符号表达式的递归函数以及其通过机器作的计算

Recursive functions of symbolic expressions and their computation by machine

Comm. ACM 3, 4 (April 1960), 184-195.

McCulloch, W.S. [1961]. 

什么是一个人可以了解的数字,什么样的人才可以了解数字

What is a number, that a man may know it, and a man, that he may know a number

General Semantics Bulletin Nos. 26 and 27 (1961), 7-18.

Nilsson, N.J. [1971]. 

人工智能中的问题解决方法

Problem Solving Methods in Artificial Intelligence

McGraw-Hill, New York.

Turing, A.M. [1950]. 

计算机器和智能

Computing machinery and intelligence

Mind 59 (Oct. 1950), 433-460.pending 10.21 afternoon

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值