香农的首届京都奖演讲:通信和计算的发展以及我的爱好

香农于1985年获得了首届京都奖(Kyoto Prize),类别为基础科学类。同期获奖的还有卡尔曼(先进技术类)和Olivier Messiaen(艺术类)。香农曾于1959年(同维纳一起)和1967年两度被提名诺贝尔物理学奖,可惜没有入选,也许是因为数学和信息不是诺贝尔奖的主要关注领域。

在演讲中,香农对于通信和计算的发展以及他在其中的工作、以及自己的相关爱好,进行了很好的总结。其中对于人工智能做了很好的评论和展望。

本文翻译自香农的演讲原文(https://www.kyotoprize.org/wp-content/uploads/2019/07/1985_B.pdf)。题目是“Development of communication and computing, and my hobby”。

非常感谢你们。很荣幸能获得京都奖。我夫人贝蒂和我第一次访问日本感到非常高兴。当我们开始计划我们的旅程时,贝蒂带回家四本关于日本文化和风俗的书。我不知道这些书的可靠性如何,因为它们都是美国人写的。它们有一个共同点,那就是都说了一句日本谚语一一竖起来的钉子会被钉下来。我突然想到,在接受京都奖的时候,我就是这样一个钉子,站在这里。不过目前我头上没看到锤子。

科学与技术的发展

我不知道日本是怎么教历史的,但在美国,我上大学的时候,大部分时间都花在研究政治领袖和战争上一一凯撒、拿破仑和希特勒这类人。我认为这是完全错误的。历史上重要的人物和事件应该是思想家和创新者,像达尔文、牛顿和贝多芬这类人,他们的工作能对世界产生持续而积极的影响。

虽然艺术和文学可以追溯到几千年前,但大多数科学可以追溯到几个世纪前。像伽利略、牛顿和麦克斯韦这样的人发现了物理世界的基本定律,这些定律描述了自由落体运动、行星运动和电学现象。当然,本世纪的爱因斯坦、Yakuda和冯·诺伊曼这类人,继续在推动科学的发展。他们的科学发现所产生的影响往往会随着时间呈指数增长。

这些科学家的基本发现本身就是了不起的成就,但如果没有工程师和发明家(如爱迪生、贝尔和马可尼)的中间努力,就不会影响普通人的生活。这些发明和应用大部分是在最近两个世纪发展起来的,事实上,大多数是在上个世纪。珍妮纺纱机、瓦特的蒸汽机和电报是这次工业革命的先驱,它们都是在两百年前发展起来的。

电话、电灯和收音机现在都有一个世纪的历史了。就在两个月前,美国大张旗鼓地庆祝了汽车问世一百周年。飞机的发明要更近一些一一莱特兄弟的首次飞行是在1903年。

当然,在一项发明第一次成功之后,它要成为日常生活的一部分,需要很长时间。收音机直到20世纪20年代才开始普及,电视在20世纪40年代才普及。爱迪生的电灯发明于1880年,进入家庭使用还需要建设发电厂和电网、以及所有这些设备的制造厂。总而言之,一个世纪前,我们的房子没有现代化的日常便利设施一一没有电话、汽车收音机、电视、电灯、中央供暖或微波炉。 人们的生活和几个世纪前一样,基本上是一个农业社会,交通和通信都落后,人员流动很少,没有多少远程通信。

科学和技术在自身基础上以指数方式增长,本世纪的技术进步(或在某些情况下,朝有害方向的发展)肯定超过了以前所有世纪的总和。工业革命的技术发展可以大致分为三个领域一一最终目标是加工和生产物质产品的领域如工厂;与能源生产和加工有关的领域,如蒸汽或太阳能发电系统;与信息通信或转换有关的领域。在过去的五十年中,这最后一个领域的增长甚至比其他两个领域的增长还要快。

我有幸参与了通信和计算领域的许多发展。通信基本上是信息从一个点到另一个点的传输,计算则是对信息的操作和转换。

我想分享我在这个领域的一些经验,这对我来说既是职业又是爱好。

信息论

在密歇根大学读书时,我记得读过R.V.L. Hartley的一篇论文,它给我留下了很深的印象。它是关于通过各种渠道传递信息。在那之后的十年里,我花了很多时间研究这个问题,试图把信道中的噪声和信息的概率等因素考虑进来。到1948年,我提出了一个通信的数学理论,这代表了我当时的一些思考。从那时起,我的生活就基本上被信息论所控制了,包括获得京都奖。

对大多数人来说,信息这个词意味着意义和现实。但是对通信工程师来说,这是把波形从一个点传到另个点的问题,或者更简单地说,是一系列字母,或者更简单地说,是一系列0和1。

信息论的主要关注点是发现统治着信息传输或处理系统的数学规律。它建立了信息的定量度量,和各种传输、存储和信息处理系统的容量的定量度量。

信息论研究的一类问题是关于寻找使用各种可用的通信系统的最佳方法,从无关信息或噪声中分离出所需信息或信号的最佳方法。另一个问题是对一个给定的信息传输媒体(通常称为信道)确定其可能达到的上限。虽然主要是通信工程师对信息论感兴趣,但是信息论的一些概念被发现在心理学和语言学等领域也有用。

以下是被研究最广泛的通信系统类型:

在这里插入图片描述

通信系统模型

  1. 信源产生原始待传送的信息;
  2. 发射器将此信息转换或编码为适合于信道的形式,这种转换后的信息称为信号。
  3. 编码后的信息(或信号)通过信道传送到接收器。在传输过程中,信号可能会发生变化或失真。无线电接收中的静电和电视接收中的雪花是这种变化的常见例子。这些令人不安的影响通常被称为噪声。
  4. 接收器将接收到的信号解码或转换回原始信息或近似信息。
  5. 信宿是信息的目的地或预期接收者。

顺便说一句,通信系统与这里正在发生的事情没有什么不同。我是信源,你是接收器。翻译员是发射器,他正在对我的美国消息进行复杂的操作,使之适合日本人的耳朵。这种转换对于直接的事实材料来说已经够困难了,而对于笑话和双关语来说就变得更加困难。我不禁想加入笑话和双关语,给翻译出点难题。

事实上,我正打算把他翻译的录音带带给第二位译者,再把它翻译回英文。我们这些研究信息理论的人通过这种方式能收获很多欢乐。

可以看出,这个系统是足够普遍的,如果各种元素得到适当的解释,它可以涵盖各种各样的通信问题。例如,在无线电中,信源可能是对着麦克风讲话的人。消息就是他发出的声音,发射器是麦克风和相关的电子设备,将声音转化为电波,即信号。信道是发射器和接收天线之间的空间,任何干扰信号的静电或噪声都对应于上面原理图中的噪声源。无线电接收器将接收到的信号转换为扬声器的输出。信宿是听消息的人。

信息论的一个基本观点是,信息可以像一个物理量(如质量或能量)那样被处理。例如,一个信源就像一个在某个地点生产木材的木材厂。信道对应于将木材运输到另一个地点的传送系统。在这种情况下,有两个重要的量:工厂生产木材的速率R(立方英尺/秒)和传送系统的容量C(立方英尺/秒)。这两个数量决定了传送系统能否满足木材厂。如果生产率R大于传送容量C,它肯定不可能运输工厂的全部输出,它的空间不够。而如果R小于或等于C,传送系统可能行也可能不行,这取决于木材的包装是否有效(把空间塞得满满当当是最有效的)。然而假设在信源有一家锯木厂(这相当于发射器),把木材被切成小块,以这样一种方式,以100%的效率填充进传送系统的可用容量。当然,在这种情况下,需要在接收点有一个木匠(相当于接收器),在将这些木块传递给消费者之前,将它们按原来的形式装配在一起。

如果这一类比是正确的,就应该有可能以适当的单位定义一个度量R,它给出一个信源产生信息的速率,以及第二个度量C,它确定一个通道传输信息的能力(容量)。此外,这种类比表明,当且仅当生产率R不大于容量时,通过适当的编码或调制系统,信息才能通过信道传输。信息论的一个重要结论就是,可以建立具有上述性质的度量R和C。

如果我掷一枚硬币,它有一半的机会是正面或反面。这将生成一个二进制数字或一比特信息。如果我把它扔三次,它将产生三个比特,有八个同样可能的结果。通用公式为 − ∑ i = 1 N P i l o g 2 P i -\sum_{i=1}^{N}{P_i log_2 {P_i}} i=1NPilog2Pi,其中 P i P_i Pi是各种事件的概率。

当事件之间存在相关性时,上述公式会更复杂。例如,在英语文本中,辅音和元音往往交替出现。信道也可以以各种方式变得复杂。例如,在作用于连续发送符号的信道噪声之间可以存在相关性。这可能会导致计算信道容量的复杂性以及对信道的最佳编码。

计算机

现在我要把话题从通信转向一个经济和社会重要性迅速增长的领域一一计算机。

计算机在部件和结构方面经历了许多阶段。帕斯卡和巴贝奇最早的机械装置是非常精巧的复杂机械装置。在模拟计算机方面,苏格兰的John Napier在1614年发明了对数,几年后又发明了乘法器一一纳皮尔骨头,后来演变成了计算尺。几个世纪以来计算尺都是工程师的基本计算工具。我清楚地记得我上电气工程的第一堂课,教授告诉我们,上这门课你们需要买一把计算尺。我买了一把log-log-duplex的计算尺,是最大的一套,到现在我还留着。和大多数模拟计算机一样,计算尺已经过时了,取而代之的是像这样的手持晶体管计算器。它不止能做计算尺所能做的,还能做更多;小数点精确到十位,而不是三位;这个是日本制造的。

计算尺

1936年,我刚从密歇根大学本科毕业,想找份工作。幸运的是,我看到麻省理工学院电气工程系发的通知,要招人操作微分分析仪,是一台求解微分方程的模拟计算机。我能得到这份工作,并在接下来的两年里操作这台机器,是我的又一次幸运。范内瓦尔·布什(Vannevar Bush)是它的主要发明者,他喜欢称自己为工匠(tinkerer),但实际上他是麻省理工学院工学院的一名非常资深的工程师,担任工学院院长,后来担任了华盛顿卡内基研究所的负责人。

布什和他的微分分析仪

微分分析仪解高达六阶的微分方程,是当时最聪明的计算机。但模拟计算机的速度和精度注定要被电子和后来的晶体管计算机打败。

有意思的是,微分分析仪有一个相当复杂的继电器电路。继电器是相当简单的装置,它们不是关着就是开着(触点打开或关闭)。触点可以串联连接,两个触点都必须闭合才能完成连接,或者并联连接,如果任何一个触点闭合,则连接完成。这些类似逻辑和布尔代数中的与、或概念。我想到可以将布尔代数应用于继电器和开关电路的分析和设计。布尔代数和开关电路的结合,用音乐家的话说就是很合拍。使用布尔代数我们可以用较少的触点和较少的工作量设计电路。这个想法对我也很合适,既完成了硕士论文,拿到了博士生奖学金,并在贝尔实验室找到了工作。

在20世纪40年代,几个小组开始重新研究不同类型的数字计算机。其中哈佛大学的霍华德·艾肯(Howard Aiken)造了两台继电器计算机,马克一号和马克二号;贝尔实验室的George Stibitz设计的计算机也使用继电器,可以执行复杂的计算序列。

早期的电话继电器打开或关闭十几个触点。在20世纪40年代,出现了更多的微型继电器。更复杂的开关操作可以通过特殊的设备来完成,比如旋转开关继电器,它有8个触点,每个触点可按顺序连接25个位置。

大约在同一时间,宾夕法尼亚大学的普雷斯帕·埃克特(Presper Eckert)和约翰·莫奇利(John Mauchly)建造了ENIAC,这是一台使用真空管而不是继电器的计算机。

ENIAC

当然,真空管是比继电器快得多的设备,比继电器快1000倍,因此允许以更高的速度进行计算。随着时间的推移,真空管也变得更小。然而,相比继电器,真空管也有缺点。它并不擅长同时控制许多不同的电路。它需要连续的灯丝功率,寿命非常有限,最多只有几千小时。虽然这种有限的寿命对于一台有六个真空管的家用收音机来说是可以忍受的,但如果你建造一台有几千个真空管的计算机,每小时左右就会有一个真空管被烧坏。

第一台真空管计算机ENIAC在第二次世界大战中被用于计算弹道。通过将其各种电路连接在一起,它的编程(或者设置)在某种意义上就像微分分析仪一样。它可以被设置为解决一个特定的问题,但不能做很多决策。

这项工作的顾问是普林斯顿高等研究院的伟大数学家约翰·冯·诺依曼,他也许是本世纪最伟大的数学家,在纯数学、数学物理和博弈论方面做出了许多重大工作。在研究计算机结构时,他意识到,计算机在某一特定问题上所做的操作序列本身就是一种计算(类似于符号逻辑学家所写的公式),它不应像ENIAC那样插入,而应存储在内存中。它应该能够很容易地修改,甚至在计算过程中修改,实际上,甚至它本身也是一个计算的对象。

冯·诺依曼

这一时期计算机的智力进步如此之快,甚至在它们完成之前就已经过时了。可以被操作的存储程序的想法被引入到ENIAC的继任者EDVAC中。

早期计算机的这些奇怪的名字都是缩写。ENIAC是电子数字积分器和计算机(Electronic Numerical Integrator And Computer);EDVAC的意思是电子数字真空管计算机(Electronic Digital VAcuum-tube Computer)。几年后,作为一个玩笑,我设计了一台小型台式计算机,它完全使用罗马数字系统的I、V、X和C。它被称为THROBAC,是节俭的罗马数字向后看的计算机(Thrifty Roman Numeral Backward-looking Computer)的首字母缩写。

1948年,我在贝尔实验室工作。有一天,我和威廉·肖克利(William Shockley)聊天,注意到他的桌子上有一个小塑料物体,上面有三根电线。我问肖克利那是什么,他说是一个像真空管一样的放大装置,但使用的是固体物理学。这是我第一次看到晶体管,很可能是20世纪最伟大的发明。肖克利、布拉顿和巴丁因这项发明获得了诺贝尔物理学奖。

晶体管

晶体管相比真空管有着巨大的优势,几年内就基本把后者取代了。晶体管要小得多,不需要灯丝电流,寿命无限长。当然,从此晶体管在通信和计算机的几乎所有应用中取代了真空管。这些年来,它们的尺寸变得越来越小。微小的1/4英寸晶体管变成了今天的微芯片,里面有数百个晶体管。就在大约一个月前,贝尔实验室宣布了一种新的更小型化的微芯片,这种尺寸的芯片可以存储100万位。当然,我是多此一举,来跟你们谈谈微芯片。

解迷宫的老鼠

现在我想谈谈我在电脑方面的爱好。在1950年左右,我突然想到,建造一台能解迷宫的机器会很有意思。心理学家经常用迷宫来测试老鼠的智商。我决定,我的老鼠将是一根磁铁,被迷宫地板下的电磁铁移动。这根磁铁被一个类似老鼠的外壳覆盖着,可以转动,当它碰到迷宫的墙壁时,就可以发出信号,发出计算电路的信号。然后,计算机将使老鼠尝试不同的方向。

香农的解谜宫老鼠

机器操作的策略可以描述如下。它有两种操作模式,我称之为探索策略和目标策略。它们都很简单。当鼠标第一次尝试寻找目标时,会使用探索策略。对于迷宫中的每个方格,都有一个记忆,由两个继电器组成。它们能够记住四个可能的方向东南西北之一。对于一个正方形,记住的方向是鼠标最后一次访问该正方形时离开该正方形的方向。这是机器唯一能记住的关于老鼠穿过迷宫过程的数据。

在探索策略中,机器采用D方向,并将其旋转90°作为第一选择,当它来到一个广场。如果它碰到障碍物又回来了,它又会旋转90度。当它击中目标时,一个继电器操作并锁定,然后机器根据目标策略采取行动。

在目标策略中,机器以它上次访问时离开广场的方向作为第一选择,并遵循一条直接通往目标的路径。由于启动机制和中继计算电路都在迷宫地板下面,我的一些挑剔的朋友抱怨说,不是老鼠在解迷宫,而是迷宫在解老鼠。

计算电路使用了大约100个继电器,它的试错程序可以解决任何有解的迷宫。这种早期的学习机,虽然很原始,但在公众和对控制论和学习与大脑功能的科学方面感兴趣的科学家中引起了相当大的兴趣。它被刊登在《生活》杂志上。

1979年,电气和电子工程师协会(IEEE)在纽约举办了“神奇的微型老鼠迷宫大赛”。这些老鼠必须是自给自足的一一没有地板下的电磁铁或其他恶作剧。用三十年的微型化,才有可能做到这一点。然而,老鼠和猫一样大。顺便说一句,他们给了我一个纪念品,以纪念我早期在这个非常重要的问题上所做的工作。

下棋机器

国际象棋一直被认为是一种高水平的智力消遣。19世纪初,天才发明家冯·肯佩伦(Von Kempelen)展示了一种下棋的机器。实际上,这是一种诡计或恶作剧–象棋是由一个巧妙地藏在机器里的人操作的。当各扇门被打开时,里面的人会从一个地方移到另一个地方,以使观众相信里面没有人。

1914年,Torres y Quevedo进行了一次更诚实的尝试,设计一台国际象棋机器。他建造了一个装置,可以玩王和车对王的残局对弈(end game)。机器代表王和车一方,不管人类对手怎么下,机器都能几步内把对手将死。由于可以给出一套明确的规则,在这样的残局对弈中做出令人满意的举动,这个问题就相对简单了。但这个想法在那个时期是相当先进的。

在20世纪40年代,计算机领域正在迅速发展,而且我对国际象棋和计算机都感兴趣,因此花了一些时间分析如何编程让计算机下棋,并写了一篇论文讨论这个问题。我还用继电器制造了一台下残局的机器。这张1950年左右的照片显示的是象棋大师爱德华·拉斯克(Edward Lasker)和我坐在这台机器前。以现代的标准来看还是很原始的。顺便说一句,拉斯克除了是一个国际象棋大师,还是一流的围棋手,他写了一本关于围棋的书,帮助了围棋在美国的普及。

香农的国际象棋机器

从那时起,我那篇关于下棋机器的论文的观点就被这一领域的许多研究者所使用和改进,而且每年都有新的和更好的下棋程序出现。1980年,我参加了在奥地利举行的国际象棋比赛,大约有20人参赛。所使用的计算机实际上是在加拿大和意大利这样遥远的地方,并通过电话连接起来。我很高兴地看到,我的前雇主贝尔实验室的一个名为贝尔(Belle)的下棋程序赢得了比赛,它是由肯·汤普森(Ken Thompson)编写的。

顺便说一句,长期以来的国际象棋世界冠军Botvinnik,他的职业是电气工程师,一直对计算机象棋感兴趣。二十年前,在访问俄罗斯时,我安排了一次与Botvinnik的会面,我们讨论了国际象棋机器的一些问题。讨论结束后,我向他提出挑战,跟他玩一局。这让我的翻译员和同事们感到好笑。在比赛进行到一半的时候,我赢得了交换,一个车换一个马。但不可避免的是,Botvinnik做了一些巧妙的组合,最后赢了。

从那时起,计算机芯片和机器人技术使得制造越来越便宜但越来越聪明的棋手成为可能,它们已经成批地出现在市场上。每一年新的型号都玩更强的游戏,每一年我都买下所有的新机器。

大部分机器都是用闪光灯表示移动的信号,但这台机器实际上是通过棋盘下的电磁铁利用两个马达在两个维度上移动棋子一一几乎与三十年前我的解迷宫老鼠所使用的机制相同。另一个机器的移动方式更有趣。它有一个机械驱动的手,能在三维空间移动、张开和合上。例如,如果它想吃一个棋子,它会上下移动,抓住棋子,把抓到的棋子放在棋盘外侧,然后向后移动,抓住自己的棋子,并将其移动到空出的方格。在电影《The Lonely Guy》中,这台机器出现在与人类玩游戏,并在赢得游戏后与它的人类对手握手。

电影《The Lonely Guy》

目前,国际上最好的国际象棋程序已达到大师级水平,评分在2000以上。甚至有一个国际协会,有一个优雅的杂志,专门致力于计算机国际象棋。如果再过几年,电脑赢得象棋世界冠军,我也不会感到惊讶。

杂耍

最近在英国召开的一次信息论会议上我做了一次演讲。观众们都快睡着了,直到我从口袋里掏出三个球,开始玩杂耍。杂耍技巧从简单的操纵三个物体到极高难度的,伟大的意大利人Enrico Rastelli玩十个球。虽然我的记录最多是五个,但几年前我开始思考建造一种机器,这种机器要么真能做到,要么能给人这种错觉。

香农玩杂耍

经过大量的工作,我首先建造了一台机器,它能制造各种各样的杂耍世界纪录。舞台上有三个杂耍冠军。右边是罗马尼亚人Virgoaga,玩着七个球杆。他们在空中旋转,从一只手传到另一只手上。左边是俄罗斯的伊格纳托夫,他可能是当今最伟大的杂耍者,他在抛接11枚戒指。在舞台中央,伟大的拉斯泰利手握十个球,每只手五个。实际上,这些物体并不是在空气中自由移动的,而是由背景上的细黑线支撑的,这些黑线通过一个非常复杂的后台机制在其轨迹中移动。

香农的杂耍机器

当我在一个杂耍者大会上展示这个东西时,它引起了一定程度的兴趣。但很明显,杂耍者想看到真正的飞行物。所以我花了一些时间建立了W. C. Fields(一位伟大的美国喜剧演员,也是一位杂耍演员)的模型。W. C.在鼓上玩三个钢球,这是真正的杂耍,没有隐藏的电线。它已经玩了好几个小时了,一次都没有失误。此外,这实际上是蒙住眼睛的杂耍,没有从球到杂耍者手的反馈。

香农的杂耍机器人W. C. Fields

我相信今天我们可以设计出一台机器,它将创造杂耍物体数量的世界纪录——现在是由阿尔伯特·卢卡斯(Albert Lucas)持有的12个圆环。

制造像下棋机器和杂耍机器这样的设备,即使是作为一个爱好,也看起来有点可笑,浪费时间和金钱。但我认为,科学的历史已经表明,有价值的结果往往是从简单的好奇心而来的。

电脑与人脑

在杂耍、下棋或迷宫等受限领域制造模仿人脑的机器时,会遇到一些问题,这会使人意识到人脑是一台多么神奇的机器。它有大约100亿个神经元。这些在毫秒范围内的速度。人在出生时,除了基本的身体功能外,大脑几乎没有被预先编程。我们成年后所知道和所能做的事几乎都是后天习得的,从走路到语言,再到音乐和数学。

虽然计算机越来越小,越来越快,但离人脑还有很长的路要走。在做复杂的算术甚至逻辑计算方面,计算机可以让我们看起来像傻瓜一样,但它们不能很好地行走,不能认出自己的制造者。虽然人们已经编写了一些学习程序,但它们仍然非常原始。机器人的感觉器官不如人类,输出机制与人类的许多自由度相差甚远,比如说,人手对温度和触觉非常敏感。

尽管晶体管在微秒范围内工作,比在毫秒范围内工作的神经元快一千倍,但大脑的性能是如何超过这些计算机呢?最主要的原因可能是神经元在并行工作,而我们的计算机一次只能做一次操作。当我们的眼睛看一个物体时,数以百万计的神经元被激活,向大脑的枕叶同时发送信息。在那里,数以百万计的同步操作被启动,导致对人脸和物体的快速识别。信息是由眼睛并行处理,而不是像摄像机那样逐点扫描和处理。

然而,我对这方面的机器抱有很大的希望,它们将与人类的大脑相匹敌,甚至超过人类的大脑。这一领域被称为人工智能,已经发展了三四十年。它现在具有商业重要性。例如在距离麻省理工学院一英里的范围内,就有七家不同的公司致力于这方面的研究,做一些并行处理的工作。

预测未来是困难的,但我感觉到,到2001年,我们将拥有像我们一样能走、能看、能想的机器。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值