本博客简叙了詹姆斯
⋅
\cdot
⋅格雷克著作《信息简史》的主要内容以及本人的一些感受。
全书都在围绕逻辑以及信息(information),也主要从这两个方面给我带来了很深的体会:
-
人类(现在基本指智人)的口语相较于其他物种是非常灵活的,能表示没有历经的事物,但其稍纵即逝的缺点也很明显,于是人类发明了文字。文字具有持久性,也正是这种持久性使得信息,准确地说是人类在生活经验中积累的知识得以持久保存和传承,不再受制于个体的经验。更大的意义是文字重构了人类的思维。其一,体现在方法论上,即用符号替代实物,进而用符号替代符号;其二,文字的持久使人得以长时间审视字词并追索其中的含义(毕竟口语稍纵即逝,而人类的记忆有限),久而久之成为了哲学家。实际上,在这一过程中,人类发展出最一般的概念,即范畴,并尝试以范畴而非单纯的事件来组织生活中的经验,自觉地接受抽象化的训练。亚里士多德更是通过严密地组织各种范畴和关系,发展了一套推理符号系统:逻辑学。然而逻辑必然伴随悖论,例如“白马非马”悖论,哲学家们认为这是由于字词的含混不清造成的,转而采用严格而纯粹的符号,即求助于数学。然而,即便是严谨的数学也无法摆脱悖论,哥德尔不完备性定理最终告诉我们相容与完备无法同时存在。我总想起海森堡的不确定性原理,我们无法同时测量出物体的位置和动量,因为测量仪器本身就是物质构成的,或许在另一个宇宙中的“生命”能用他们的仪器测出来。任何体系就像一个瓶子,瓶子内的事物及其关系都能完美澄清,然而瓶子之外是无法知晓的,是不可证的。不完备性定理似乎并未阻碍数理逻辑的应用与发展,严谨的数理逻辑与有条不紊运转的机器一拍即合,加之人们对计算能力的需求,机器计算得以快速发展,图灵机的诞生就是一个里程碑事件。机器计算也促进了数理逻辑的发展,促进了人们对信息本质的理解。
-
物质 的构成形态由信息决定,信息的增删必然涉及能量的改变。根据兰道尔原理,信息的擦除是需要消耗能量的。例如蛋白质拥有复杂的空间构型,就是因为从DNA再到RNA获得了信息,当然还有细胞环境的信息。物质、信息以及能量都满足守恒定律。能量存在各种形式,能量的转化伴随信息的转移,发射电磁波信号就体现了这一过程。能量看不见摸不着,信息也一样,所以需要借助物质来显现。物体运动时,我们认为其具有动能并用 1 2 m v 2 \frac12mv^2 21mv2来度量,同样地,一串特定的01字符蕴藏着信息,又该如何度量信息的大小呢?香农借助了物理学中的随机过程,可以认为一串特定的01字符串是由一个随机过程(参考博文)产生的,该随机过程拥有的状态越多,或者说生成一串字符的不确定性越高,那么蕴含的信息越多。香农采用熵 H = − ∑ p i l o g 2 p i H=-\sum p_ilog_2p_i H=−∑pilog2pi来度量这一不确定性,其中 p i p_i pi就是状态i生成的概率(香农在论文中给出了这一公式详细的推导过程以及理由,感觉数学的力量很强大,能将人类对信息的直觉感受度量得这么精准),通俗的理解是假设只允许回答是或否,那么猜测出一条未知讯息所需问题的平均数目就是H。香农熵似乎在度量出乎意料的程度,想象从越多的状态中挑出特定的一个,出乎意料的程度越大,我们直观的感受就是信息量好大啊!(好比狗咬人不是新闻,人咬狗才是新闻),显然用香农熵来定义信息的大小是合理的。总之,信息就是一个随机过程的一个特定结果,信息的大小就是该随机过程的不确定性程度。
我不赞成万物皆比特(it from bit)的说法。在我看来物质始终是第一性的,能量也好,信息也罢,脱离物质都将是不存在的。信息告诉物质该处于什么样的形态,能量则驱使物质达到相应形态。例如发送电磁信号,本质就是输入能量,调节电磁波的振幅以及频率处于特定的形态。另外发现许多文章将信息和讯息(message)混用,我认为有必要说明下,讯息无非是信息的一种特殊形式的载体,讯息本来就是物质,电磁波、纸带等都是具有特定形态的物质。人在捕获到讯息中的信息后,在自身知识的基础上,再还原出讯息关联的物体。
接下来简单说说这本书各章的内容,全书共15章,大致如下:
第1章讲叙了非洲古老的鼓语,即通过不同音高的鼓声传递信息,这看似一种非常原始的编码。传递信息的容量较小,容易混淆,当然鼓语也引入了 冗余 (为了克服歧义,额外引入的讯息)。
第2章讲叙了人类的文字。这一章写得很精彩,主要讲叙了从实物,文字,范畴,逻辑最后到数学的一个曲折的发展过程。
第3章讲叙了文字的不确定性和书写的随意性造成的一些问题以及一些应对措施。
第4章讲叙了人类开始尝试将数当作商品,用机器操作符号去生产想要的数。本章大篇幅书写了巴贝奇的工作,即尝试用机器来做运算。
第5章讲叙了从信号塔(视觉信号)到电报(电脉冲信号)的发展历史。
第6章讲叙了由电报编码引出的一系列逻辑问题。克劳德
⋅
\cdot
⋅香农首次用布尔代数来描述电路,推动能够操作符号的机器的发展,而这使得逻辑学再度赋予新的活力,逻辑学与数学也开始融合,创建出由公理、符号、公式和证明构建的体系。然而这个体系并非坚不可摧,悖论引发了危机。哥德尔基于元数学给出了哥德尔不完备性定理,表明一个算术体系不可能同时完备和相容。但是悖论似乎并未阻碍新的电信号传输技术–电话的出现!这一技术的出现引发了人们对信息传输容量的研究,同时人们急需准确定义信息一词,并准确度量它。奈奎斯特和哈特利提出排除心理因素,讯息含有的信息量应该正比于讯息包含的符号数。
第7章讲叙了信息论的诞生。这一章讲得非常精彩。阿兰
⋅
\cdot
⋅图灵提出可计算数(小数表达式可在有限步骤内计算出来的数)的概念,并进一步提出了著名的图灵机这一思想机器。香农借鉴物理学中随机过程的方法论和术语给出了信息的定义,其论文《通信的数学理论》标志着信息论的诞生。香农同哈特利一样,剔除了讯息的意义来研究信息,他将一条讯息视为随机过程的一个结果。
第8章讲叙了信息论引发的其他科学领域的变革。
第9章讲叙了熵以及麦克斯韦妖引发的“悖论”。齐拉特提出信息不是免费的,解决了麦克斯韦妖引发的“悖论”。接下来的研究进一步表明物理学中的熵与信息没有本质的区别。
第10章讲叙了信息论引发对生命的编码的研究。
第11章讲叙了道金斯的模因。
第12章对随机性进行了探讨。蔡廷提出一个数如果是可计算的就不是随机的,也就是说可计算性是随机性的一种度量。柯尔莫哥洛夫提出复杂度的概念,并基于算法对其进行了度量。实际上,信息、随机性与复杂度本质是一样的。然而,由于哥德尔的不完备性定理,蔡廷与柯尔莫哥洛夫提出的算法信息论同样是无法避免悖论的。
第13章讲叙了量子信息论。当量子力学的发展遭遇危机之时,富克斯另起炉灶,提出量子信息论。
第14、15章主要讲叙了信息社会的一些问题以及展望。
信息产业蓬勃发展的大背景下,我认为每个从业者都需要构建起一个对信息全面而清晰的认识,从豆瓣中看到这本书评价很高,特地花了一个星期把这本书看完,感触颇深,写下这篇博客,其中有些内容是我个人感受。一千个人就有一千个哈姆雷特,不同的时间段阅读同一本书也会有不同的感受,暂且写这么多了,以后还会重新阅读这本书的。