长度是怎样炼成的

转者注:

       初涉神经网络时,看到了“测度”这个概念,于是翻阅了一些测度论教材去学习什么是测度,翻阅后发现这些教材太“理论”,压根没用门外汉能懂的语言来解释测度。于是又去在网上翻阅资料,发现了这篇好文章——以“长度”为引子,述说了什么是“测度”。

       写到这里得吐槽一下。我的导师给我们讲问题的时候经常对我们说:“对于我接下来要讲的问题,如果你们没有听懂,一定要告诉我,我再换种方式给你们讲。听不懂不是你们的理解能力有问题,而是而是我的讲述能力有问题。”读完下面这篇文章后,自己回顾了一下自己之前写的一些博文,突然觉得这些博文似乎只有自己才看得明,与其称为博文,不如称为笔记,因为这些文字可能就是在浪费其他读者的时间,更甚地情况时,隔得时间长了之后,自己再看自己写的东西,也会觉得很陌生,这可能是因为自己写东西时压根对写的东西就没有“深入”理解。

       在此立下决心,以后写文章要有“服务精神”——至少要为将来忘了这些知识时的自己服务。

-------------------------------------------------下接正文----------------------------------------------------------

源于  http://www.blog.edu.cn/user2/tchzhang/archives/2006/1359252.shtml
应小乐之请写的一个东西,其目的是为了回答以下问题:

点没有长度和面积,为什么由点组成的线和面会具有长度和面积?
“长度”“面积”这些词汇究竟是在怎样的意义上被使用的?
有的时候我们把点的长度叫做零,有的时候叫做无穷小,这两个称呼是不是都有道理?
无穷个零相加是不是还得零?(其实和第一个问题是一个意思,无穷个点怎么加成线段的?)
等等等等。

当然,小乐的问题是着眼于哲学,而我的回答将会着眼于数学,——我不是学哲学的,但是大概也知道在哲学上这些词汇常常导致混乱的争论,比如芝诺悖论之类。幸运的是,早在一百年前,通过一大批杰出的数学家的努力,以上这些问题已经被精确地给出了解答,这就是在数学中被称为“测度论”的一套理论体系。这里“精确”的意思是说,这套理论体系完全基于形式逻辑,而且只采用了非常少的公理(下面会陈述之),从而,在这套理论中不存在任何模糊或者逻辑上模棱两可之处(除了几个需要加以特别说明的地方=_=!)。换句话说,我们不仅可以认为数学家能够确定无疑的回答以上这些问题,而且可以认为人类在今天能够确定无疑的回答以上这些问题(在承认那些公理的前提下)。

不幸的是,这一断言几乎必然会遭到哲学家的反对。一方面是因为哲学家们倾向于每个人自己创造一组定义,——从我在未名哲学版见过的一系列关于芝诺悖论的讨论来看,这样的结果是所有的论述最终都流于自说自话。另一方面大概也因为学术壁垒的缘故,哲学家们大概从来也没有了解过数学家们已经在此问题上做出过的卓越工作,(确实,很多细节是过于数学化了一点……)。有鉴于此,我答应小乐以尽可能通俗的方式(在不损害准确性的前提下)大致介绍一下测度论的内容。我想在这个版面上大概还会有不少别的朋友对此感兴趣吧。

下面正式开始。


一、关于无穷

当我们使用“无穷”这个词的时候,我们必须时刻谨记,这个词有两种截然不同的意义——不,我这里说的不是亚里士多德关于实无穷和潜无穷的那些绕口令,而是某些重要得多的本质问题,对他们的清晰阐释开始于伟大的德国数学家康托Georg Cantor (1845-1918):当我们说一个集合有无穷多个元素的时候,我们必须指明这里的无穷是哪一种,是“可数无穷”还是“不可数无穷”。虽然都是无穷集合,但是它们会体现出截然不同的性质。

为了说明这一问题,我们引进集合的“势(cardinality)”的概念。简单说来,势就是集合的元素的个数。一个集合有三个元素,我们就称其势为3。两个集合如果元素个数相等,我们就称它们为等势的。——很显然,要判断两个集合是不是等势,只需要看这两个集合之间能不能建立起元素的一一对应即可,如果可以的话,我们就说这两个集合的元素是一样多的。

到这里为止都显得很简单。可是最有趣的部分马上就要出现了:康托指出,不但对于有限个元素的集合我们可以讨论它们的势,对于无穷个元素的集合,我们同样可以讨论它们之间是否等势。换句话说,我们可以讨论两个无穷集合的元素是不是一样多!

之所以如此,是因为集合之间的“一一对应”本质上只是个数学概念,是可以被精确研究的对象(请回忆高中数学课本关于映射的那一章)。从而,随便拿两个集合来,它们之间是否能建立一一对应只是数学上的问题而已。

以下是一些最基本也是最著名的例子和命题,请尽量耐心的阅读。所有这些陈述都是可以基于最简单的形式逻辑给出严格证明的,证明可以在参考文献[1]上查到:

·每一个集合都和它自身等势。

注:废话。

·全体正整数的集合和全体正偶数的集合等势。

注:这是第一个有趣然而迷惑人的结果。我们等于是在说:一个集合可以和它的一部分一样多!——但是这并不是一个悖论。我们通常觉得一个集合不能和它的一部分一样多只是针对有限集合而言的,本来就没人说过无限集合不能和它的一部分一样多,只是有时候大家会不自觉地有这个误解而已。

·全体正整数的集合和全体有理数的集合等势。(什么是有理数来着?查书去!)

注:这是在数学上很重要的一个例子,说明一个实数中的稠密集可以和一个离散集等势,不过大家看到这里大概已经开始打瞌睡了……跳过这个例子!

·全体正整数的集合和全体实数的集合不等势。

注:睁大眼睛,迄今为止最重要的一句话出现了!你永远不可能在全体正整数的集合和全体实数的集合之间建立起一一对应来。对这个陈述的证明是数学上最有趣也最迷人的证明之一,可惜的是篇幅所限我不能在这里证明给大家看。那么只讨论结论好了:并不是所有的无穷集合都是等势的,有一些无穷集合比另一些无穷集合的元素更多,换句话说,无穷之间也是有大小的。

·任给一个无穷集合,我们都能够造出一个集合包含它,而且和它不等势。

注:换句话说,无穷和无穷相比,没有最大,只有更大。——但是请注意,虽然我们能够造出越来越大的无穷集合,但是我们并不真正对那些太大的无穷感兴趣,因为和这个世界没什么关系。

·如果两个集合都和第三个集合等势,那么它们彼此也等势。

注:好像也是废话,但是它引出了下面的重要陈述。

· 有很多集合都和全体正整数的集合等势,从而它们彼此也等势,我们称所有这样的集合为“可数无穷的(countably infinite)”。有很多无穷集合比全体正整数的集合的势更大,我们称所有这样的集合为不可数无穷的(uncountably infinite)。但是,不存在无穷集合的势比全体正整数的集合的势更小。

注:我们待会儿再来讨论为什么起这么两个名字。前面的例子告诉我们,全体正偶数的集合是可数无穷的,全体有理数的集合是可数无穷的,但是全体实数的集合是不可数无穷的。

·在不可数无穷集合中间,有些集合是和全体实数的集合等势的,这些集合被称为“连续统(continuum)”

注:好了,现在我们对全体无穷集合建立了一个简单的分类。最小的一类称为可数无穷集。剩下的都叫不可数无穷集。不可数无穷集里面又有特殊的一类叫作连续统,剩下当然还有一些非连续统的不可数无穷集,但是它们几乎和真实世界没有任何关系,所以忽略之。(有人不愿意忽略它们,非要去研究里面的一些麻烦的问题,于是产生了数学中间最让人头晕的一部分结论,比如什么哥德尔不完全性定理之类……这个定理偏偏还特别著名,很多人都问过我它究竟说的是啥。相信我,你不可能弄明白的。)

也就是说,我们真正关心的是两类特殊的无穷集合,一类称为可数无穷集,一类称为连续统。所有的可数无穷集彼此等势,所有的连续统彼此等势,但是任何可数无穷集和连续统之间不等势,后者总是更大一些……真绕嘴阿。

下面是一些可数无穷集和连续统的例子:

可数无穷集:

自然数集,整数集,有理数集。(基本上,如果你在平面上或者直线上随手点无穷个点,并且这些点彼此都不挨着,那么它们的总数就是可数无穷的。但是也存在一些不这么简单的可数无穷集。)

连续统:

实数集,直线上点的个数,平面上点的个数,一个正方形里点的个数,或者简而言之,一切几何对象里的点的个数都是连续统。(这里一个常常被人提到的推论就是直线上的点和平面上的点一样多,——都是连续统那么多。其实证明很简单,但是一言难尽,请查书去。)

好了,现在我们可以讨论这两个名字是怎么来的了。请注意,所有的可数无穷集都是可以和正整数建立起一一对应的,这是什么意思呢?这意味着,我们可以把一个可数无穷集中的每个元素都对应到一个正整数,这相当于给他们编了号码,从而我们可以去数它们(这就是可数这个词的来历)。也就是说,我们可以按照1号、2 号、3号这么一直数下去,虽然总数是无穷的,但是只要我们在理论上一直数完所有的自然数,我们就能真正数遍这个集合的所有元素(至少在想像里是这样)。

而连续统集合却不是这样。一个直线上的点是连续统,这就是说,无论怎么巧妙的给这些点编号,我们都是不可能给所有的点都编上号码然后一个一个的数下去把它们都数完的。它们是“不可数”的。

有人会说,这不是自欺欺人么?反正都是无穷个,反正事实上总也不可能数得完,那么在理论上区分“想像中数得完”和“想像中也数不完”有什么实际意义呢?

有的。正是这一点微妙的差别,使得有些事情我们能够对可数集去做却不能对连续统集合去做,也正是这一点差别,促成了从没有大小的点到有大小的直线和平面之间的巨大的飞跃。


二、测度的建立

让我们暂时放下关于无穷的那些讨论,回到主题:我们通常所说的长度面积体积这些词,究竟是什么意思?

为了更清楚的阐明这个主题,让我们把目光只集中在最简单的一维情形,也就是说,我们只考虑“长度” 这个词。我们希望,取出直线上的一部分,就有一个“长度” 存在。如果能做到这一点,那么类似的,面积和体积之类的高维词汇也可以类似的得以理解。

我们把目前要回答的问题列在下面:

·什么是长度?

· 是不是直线上任何一部分都可以有长度?直线上的一个线段当然应该有长度,直线上的两段分离的线段也有总长度,单点有没有长度呢?随便从直线上挖出一些点来得到的也许是虚虚实实的一个“虚线段”有没有长度?是不是我们从直线上任意取出一个子集合(线段啦单点啦都可以看成是直线的特殊的子集合),都可以定义它的长度?

——这件事无论在数学上还是应用上都是重要的,如果能够给直线的任何子集定义长度,那就太方便了。

·如果上面这件事是可以的话,那么随便给一个直线上的点集,长度怎么计算?

等等等等。

事实上,在数学中这些问题都能够得到解答,但是首先让我们把上面问题里的“长度” 这个词都换成更准确的一个术语:测度(measure)。之所以要采用这么一个新造的词,首先是因为“长度”有时候有局限性。一个线段的长度好理解,一个复杂的点集,说长度就会显得很奇怪;不仅如此,在二维情形下我们还要研究面积,三维还要研究体积,四维还要研究不知道什么积……为了省去发明一个又一个新词的苦恼,我们把这些东西统一叫做二维测度,三维测度……一了百了。

好吧,那么,我们来定义(一维)测度。

——不,不要误会,我并不是要在此刻写出一大段难懂的话,告诉大家“测度就是什么什么什么什么。” 或者更谦逊一点,说“我认为,测度就是什么什么什么什么。” ——也许这是一般人看来自然不过的工作方式,但不是数学家的。

这是因为,我们现在要定义的是某种特别基础的概念。也许在定义某些很复杂的高层概念的时候这种方式很自然,可是概念越基础,这种方式带来的问题就越大。关于测度这种层次的概念几乎必然伴随着用语言难于精确描述的种种晦涩的思考,一旦一个人试图把他对这个词的理解宣诸笔墨,那么无论他多么小心翼翼的整理他的陈述,在别人看起来他的定义都必然漏洞百出,有无数可以商榷的地方。——而因为这个概念在整个逻辑体系中的位置过于基础,任何商榷又都必然说起来云山雾罩,像哲学家们通常进行的关于基础概念的争论一样令人头昏脑胀。如果数学家们要开会用这种方法给出测度的定义,那一百个数学家一定会提出一百零一种定义来,最终的结果是什么有效的结论也得不到。

数学家们采用的是完全不同的方式:我们先不要贸然去说“什么是测度”,而是先问问自己,当我们想发明一个新的定义的时候,我们在这个定义的背后是想达到怎样一种目的?换句话说,我们想让这个定义实现哪些事情?

首先,测度——不管它具体怎么定义,其作用的对象按照我们的期望是直线上的任意一个子集,而最后得到的测度应该是一个具体的数字。也就是说,所谓定义测度,就是我们需要找到一种方法,使得随便拿来直线上的一个子集,我们都能够最终得到一个数字作为其“长度”。(在这里我们把无穷大也看成是测度,例如整根直线的测度就是无穷大。)

然后,这种方法总要满足一些必要的约束。——不能随便给一个线段标上一个数字,就说它是测度了。这些约束有哪些呢?

第一,空集(注意是说空集而不是说单点集)本身也是直线的子集,也应该有个测度。我们应当保证空集的测度是零。这是很显然的,否则这个测度就毫无实际意义了。

第二,既然每个子集都有一个测度,那么把两个彼此本身不相交的子集并在一起得到的新的子集也应该有个测度,并且这个测度应该等于两者之和。——这也是很直观的要求。两个线段如果不相交,那么他们的总长度应该等于两者长度之和。更高维的情况也一样,两个二维图形如果不相交,那么总面积应当等于各自面积之和,诸如此类。

更进一步,三个不相交子集的测度之和也应该等于这三个子集并起来的集合的测度,四个也对,五个也对,依此类推,无穷个不相交子集的测度之和也应该等于把它们并起来得到的集合的测度。——注意,是可数无穷个!

(为什么呢?直接说任意无穷个不好么?干嘛只限定是可数无穷个?)

数学家是很谨慎的。上面这个性质被称为可数无穷个集合的测度的“可加性” ,承认可数无穷个集合有可加性是不得不为之,因为在实际应用中我们确实常常会遇到对可数无穷个子集求总测度的问题,可是任意无穷个子集的测度也能相加,这个陈述就太强大了,我们一时还说不好测度有没有这么强的性质,还是先只承认可加性对可数无穷个集合成立好了。

第三……

“且慢” ,数学家说,“先别找太多的约束,看看这两条约束本身能够在多大程度上给出测度的定义好了。”

(什么嘛,这两条约束根本什么都没说。第一条是废话,第二条也是很显然的性质,要是只满足这两条就可以叫做测度,那测度的定义也太宽松了,我随随便便就能构造出好多种不同的测度出来。)

也许是这样,可是到时候再添上新的约束也不迟。这也是数学家们常用的办法,先定义尽量宽松的概念,然后再一点一点的附加条件,得到更细致和特殊的子概念。就目前的情况来说,看起来这两条约束确实是宽松了点……

不幸的是,——也许出乎你的意料,——这两条约束不是太宽松,而是已经太严苛了。我们可以证明,给直线的每个子集都标上数字作为测度,保证空集的测度是零,并且测度满足可数无穷个集合的可加性,这件事情在逻辑上并无内在的矛盾,但是这样的测度必然具有一些数学上非常古怪的性质。也就是说,这样的测度根本不能用来作为对长度的定义!

(关于这件事的证明其实很简单,但是需要一点数学基础才能读懂,详情可以参考文献[1]。关于什么是“古怪的性质”,后面还会提及。)

在这种情形下,我们只好退而求其次,减少对测度这个概念的期望。——可是前面提到的两条性质都再基本不过了,如果连它们都不能满足,我们定义出来测度又有什么用呢?——于是数学家们另辟蹊径,不是放松这两条限制,而是放松它们的适用范围:我们不去强求测度能对直线的每个子集都有定义,也就是说,我们只挑出直线的一些子集来定义测度,看看能不能避免逻辑上的困境。

需要挑出那些子集呢?很显然,我们希望对于平时人们能接触到的各种常见的子集都能定义测度,所以单点集是需要的,线段也是需要的,而若干线段的交集或并集(这里若干还是指至多可数个)也是需要的,对它们的交集或并集再作交集或者并集也是需要的……

在数学中,我们把所有线段反复做交集或并集生成的这一大类集合称为可测集(当然它有更严格的定义,不过大概就是这个意思)。不要小看这种生成方式,事实上,你能想象得到的直线的子集其实都是可测集,——要找出一个非可测集的集合反倒是有点困难的事情。虽然可测集不包括直线的全体子集,但是如果我们能对所有可测集定义合理的测度,那这个测度也足以应付人们的需要了。

所幸的是这确实是可以做到的。在测度论中有很大的一部分篇幅是用来论述测度是怎么对可测集得以建立的,这部分内容一般被表述为一个称为Caratheodory’s theorem的理论。言简意赅地说:是的,只针对可测集定义的,满足前面那两条假设的“合理”测度总是能够建立得起来的。

这里所谓的“合理”,就是说它能够用来作为我们心目中那个“长度”而存在。为了说明这一点,让我们想想我们离我们的目的地还差多远:直到现在为止,我们还是完全不知道一个测度究竟是什么样子。举例来说,按照我们的想法,一个单点集的测度应当是零(对应于点没有长度的直观),而实数轴上从0点到1点的线段的测度应当是1,更一般地,从a点到b点的线段的测度应当是b-a,——可是这一切我们统统还不知道呢!

这一切确实还未曾得到说明,而且更关键的是,仅仅有前面给出的那两条假设,我们也确实无法推理得出上面那些结论。这也是数学家们的通常做法:先有一个一般的概念,然后通过给它添上一些新的独立约束来构造出更细致的概念。我们现在已经有了一个一般的测度的概念,把它总结一下,就是说:

对于直线的一大类子集(也就是可测集,谢天谢地,我们在应用中真正关心的集合都属于可测集),我们能够在不伤害逻辑的自洽性的前提下,给他们中的每个都标上一个数字,称为测度,并且这些数字满足下面两条性质:

·空集对应的数字(空集的测度)是零。

·若干个(但是至多可数无穷个)彼此不相交的子集,它们并在一起得到的子集的测度,刚好等于这些子集各自测度之和。

我们只知道这样的测度是存在的,但是很显然并不唯一,因为我们未曾对这些具体的数值作过任何限定。为了使测度能够符合我们心目中的那个“长度”的概念,我们需要进一步添上一条需要满足的性质:

·如果把直线看作实数轴,那么从数轴上a点到b点的线段(这是直线的一个子集)对应的测度应当等于b-a,例如,数轴上从2到3的这一段线段的测度应该等于1。

乍一看这好像只是个不完全的限定,我们只规定了最简单的线段的测度,却没有规定剩下那许多奇奇怪怪的集合的测度,可是好在有数学推理来替我们包办剩下的一切:只要添上这条约束,那么所有的可测集的测度的具体大小就会以唯一不导致逻辑上的矛盾的方式被确定下来。也就是说,对于任何一个可测集,我们都有办法算出它所对应的那个唯一可能的测度来。(怎么算的?如果你不想看到数学式子的话就别问了……)

需要说明的是,同样也是根据这三条,我们就能够发现单点的测度必须是零(否则就会导致计算上的矛盾)。注意:这里的逻辑完全是数学的而不是哲学的,也就是说,我们是可以“推导”出单点的测度是零这样的结论的。

各位看到这里可能会很疑惑,我究竟在干什么?我并没有回答事先许诺要回答的任何一个问题(为什么点的长度是零而线段就不是,诸如此类),而是蛮横无理的把它们作为规定和规定的推论强制性的摆在这里,作为测度的定义的一部分。这算什么回答?

请允许我把对此的解释(以及对前面所有那些哲学性问题的解释)放在后面,先暂且回到测度的定义本身上来。

前面说了,只要能满足头两条性质,我们就称定义出来的那个东西为测度,加上第三条只是为了让这个测度符合我们对长度的具体数值的要求。也就是说,加上第三条性质后,我们定义出的应当只是测度中的具体某一种,一般把它称为勒贝格测度(Lebesgue measure)。再强调一遍,正如前面所说的那样,勒贝格测度并不能定义在直线的所有子集上而只能定义在其中的可测集上。但是我们在数学中和应用中能够遇到的集合差不多全是可测集。

(那就总还有几个不可测集了?是的,确实存在一些特别诡异的集合是不可测集。关于不可测集的构造和性质一直是数学上一个有趣的话题,——虽然并不重要,因为事实上在真实世界里我们遇不到它,它们只是作为抽象的数学构造出现的。我们后面还会再次谈及这个问题。)

既然勒贝格测度只是测度的一种,那就是说,数学上是承认不同于勒贝格测度的更一般的测度存在的。这些测度只满足三条性质的前两条,而未必满足第三条,也就是说,这些“测度”并不保证从0点到1点的线段的测度是1,甚至也未必保证单点集的测度是零。它们的性质可能和通常人们对长度的理解很不相同。

(为什么呢?既然明显和常识相悖,为什么还要保留这些人造的概念呢?)

这是因为,尽管数学家发明测度的概念的初衷确实只是想把“长度”的概念精确化和逻辑化,(事实上也确实做到了,就是勒贝格测度),但是人们很快发现,那些更一般的测度虽然未必还符合人们对“长度”这个词的理解,但是它们作为一种数学概念却能在大量的学科里得到应用,甚至成为很多理论的基础语言。一个最简单的例子是概率论,这门古老的学科在测度论建立之后就完全被测度的语言所改写,以至于今天一个不懂一般测度的人完全没办法研究概率论;另一个例子是著名的狄拉克测度(Dirac measure),这个曾经令数学家也有点头痛的非正常测度在物理学和信号处理等领域里扮演了非常关键的角色。

三、长度的意义
  回到我们的主题:“长度”的意义上来。
  先总结一下我们已经知道了的事情:
  所谓(一维)测度,就是要给直线上的每个子集标上一个数字,使得它们满足下面两条性质:
  •空集对应的数字(空集的测度)是零。
  •若干个(但是至多可数无穷个)彼此不相交的子集,它们并在一起得到的子集的测度,刚好等于这些子集各自测度之和。
  这样的测度存在很多种,而且几乎全都行为古怪。为了更好的符合“长度”的概念,我们添上第三条要求:
  •如果把直线看作实数轴,那么从数轴上a点到b点的线段(这是直线的一个子集)对应的测度应当等于b-a。
  满足这三条性质的对直线上的每个子集定义的测度是不存在的。但是,如果放松要求,不对直线的每个子集定义而只对直线的可测子集定义测度,那么这样的测度存在并且唯一,数学上称为勒贝格测度。靠一系列定理的帮助,对直线的任何一个可测集(一般来说你能想象到的任何子集都是可测集),都有一套严密定义的公式能够把这个测度的具体大小算出来。
  于是,数学家郑重宣布:
  勒贝格测度就是人们通常所说的“长度”的严密定义,而且是唯一正确的定义。
  “什么?”我们的哲学家朋友们一定要跳起来了。“你上面绕来绕去的说了一大堆让人听不懂的话也就罢了,你怎么能说这是关于长度唯一正确的定义呢?这顶多是你们数学家对这个词的理解而已,我最讨厌你们学理科的用这种自以为掌握绝对真理的口气说话了!”
  “是么?”数学家回答道,“难道长度这个词还可能有别的理解不成?”
  “当然可以。”哲学家愤愤不平地说。“亚里士多德说过……,莱布尼茨说过……,康德说过……,****同志说过……,总之,人类对长度这个词的理解是经历过漫长的争论的,而且必然还会一直争论下去。每个人都有权提出自己的观点啊。”
  “我不管他们怎么说,”数学家说,“我只问你心里有没有对长度的定义?”
  “当然有了。”哲学家骄傲地说,“我认为,长度就是……”
  “慢着,”数学家迫不及待的打断他,“我不想听你的哲学论文,我只问你,在你对长度的定义里,空集有没有长度?有的话,是不是零?”
  “是……的。”其实哲学家暂时没想到空集这么细节的事情,但是他觉得反正这个无关紧要吧,所以先首肯了。
  “那么,按照你定义的长度,数轴上从2.76这个点到6.98这个点的线段的长度,是不是等于6.98-2.76=4.22?”
  “这个废话,不然还叫什么长度啊。”哲学家有点不耐烦了。
  “还有,如果我把可数无穷个有长度的集合放在一起,总长度等不等于各自的长度之和?”
  “这个……”哲学家对于“可数无穷”这个词有点拿不准,“反正两个线段的总长度是等于它们各自的长度之和的,至于无穷个……好吧就算是吧,那又怎样?”
  “那就结了。”数学家慢条斯理地说。“我根本不关心你关于长度的哲学观念是怎么建立起来的,我只想说,如果你的观念没有内在的逻辑矛盾,那它就一定和我们数学家所说的勒贝格测度是一回事。这就是我为什么说勒贝格测度是唯一正确的长度的定义。——你当然可以有你自己的定义,只不过它一定正好就是勒贝格测度!”
  “什么和什么呀!”哲学家有点懵了。“可是你什么也没有定义啊,你只是自己号称证明了一个所谓勒贝格测度的存在,可是我们关心的是为什么!我们哲学家要问的是为什么从2.76这个点到6.98这个点的线段的长度等于4.22,你却把它写在了定义里,这并没有回答问题本身啊。”
  “唉,”轮到数学家不耐烦了。“从2.76这个点到6.98这个点的线段的‘长度’当然也可以不等于4.22,只要你不取勒贝格测度而换一种测度就成了,——问题是人们不喜欢那样啊。不是为什么它的长度等于4.22,而是你首先要求了4.22这一属性,然后把它叫做长度。为什么只有在春天桃花才会开?因为是你把桃花会开的那个季节叫做春天的!”
  哲学家:“……”
  数学家:“……”
  嗯,我不知道这段对话是把问题讲清楚了还是搅得更混乱了。当然这里面还有许许多多的细节需要阐明,下面让我们来更仔细的讨论一下吧。
  “长度是什么?为什么从2.76这个点到6.98这个点的线段的长度等于4.22?”正如前面那个数学家所说的,这个问法本身就是不合适的。我们给从2.76 这个点到6.98这个点的线段赋予一种属性是4.22,给从姚明的头到姚明的脚的线段赋予一种属性是2.26米,现在我们把这种属性叫做长度,如此而已。 ——这完全是人为的设定,没有任何先验的意义。数学家已经说了,你当然也可以给从2.76这个点到6.98这个点的线段赋予另一种属性是3.86,给从姚明的头到姚明的脚的线段赋予另一种属性是0.03米,只要你足够细心,这种做法是不会引起问题的,只不过你自己定义的那种属性不再被人们称作“长度”罢了。你可以把它称为“短度”或者别的什么,没有问题。
  有趣的是,——测度论的伟大也就体现在这里,——只要我们承认了诸如从2.76这个点到6.98这个点的线段的长度等于4.22这样一些朴素的论断,那么仅仅靠着逻辑推演,我们就能够给直线的几乎所有子集——可测集——计算出对应的“长度”来,哪怕它们已经变得不是那么直观。譬如说,单点集的“长度”是0(不是什么无穷小,就是0),2到5之间的全体无理数的集合的“长度”是3,某个广义康托集(一种有着复杂分形结构的点集)的“长度”是2.86……这一切本来似乎都可以问一问为什么的事情,其实都只是逻辑的自然推论罢了,你要是不承认它们,就必然导致逻辑上的不自洽。
  
  ——为什么这个东西的长度是0?那个东西的长度是2.3?为什么这个奇奇怪怪的集合也会有长度?为什么它的长度不等于别的,偏偏等于根号2?
  因为长度满足那三条性质,所以必然如此。
  ——为什么长度要满足那三条性质?
  因为人们把满足那三条性质的属性就叫做长度。你当然也可以用别的几条性质定义出来一个什么度,只是不能再叫长度就是了。
  这就是“长度”这个词的全部意义。
  
  “可是,”我们的哲学家还是不甚满意,“我还是觉得你没有真正回答我想问的问题。”
  “还有什么呢?”数学家说,“我上面这些理论不都已经自圆其说了么?”
  “就是这个自圆其说让我特别恼火。”哲学家说。“我总觉得你绕过了我真正的问题。我问为什么长度要这么定义,你说因为人们把这样定义出来的属性就叫长度,这当然没错,可是我其实想问的是,为什么会有这样一种属性存在?为什么自然界中的事物可以具有长度——或者用你的话说——这种属性?你当然可以告诉我说,因为数学上证明了你的那什么勒贝格测度一定存在,可是我不想听你那个证明,我想听到的是一个更深入的解释,为什么长度是得以存在的?”
  “因为……因为我们能证明它实际上存在……”数学家迷惑不解的说。
  “我不是问你它存不存在,我是问它为什么存在!”哲学家怒气冲冲的说。“你不觉得这是件不太自然的事情么?反正是一堆点,你又说了点的长度是零,可是一旦把点排列起来得到的线段就有了测度,在这个过程中发生了什么呢?这个不为零的长度是怎么出现的呢?——别又对我说你能证明它不为零,我要问的是为什么,——比证明更本质一步的那个为什么!”
  “啊,”数学家字斟句酌地说,“你想问的其实是为什么线段的测度不等于简单地把点的测度加在一起对吧。是啊,这确实是个有趣的问题……”
  
  这确实是个有趣的问题。
  如果我们仔细检查关于勒贝格测度的那三条公理,会发现关于第一条和第三条并没有什么可多说的,可是第二条——至多可数个彼此不相交的子集的并集的测度等于这些子集各自测度之和——却多少让人心生疑惑。这句话读起来总是有点别扭。
  如果我们把它换成“有限个彼此不相交的子集的并集的测度,等于这些子集各自测度之和”,听起来就会舒服多了,可是这里做了某种推广,从有限到无限,而且还不是任意无限个而是“至多可数无穷”个,这是为什么呢?
  首先,这种推广是必须的:只对有限个的子集定义测度的可加性,这样得出来的测度会不满足人们的需要,——不仅仅是给长度一个精确定义的需要。测度论不只是为哲学家发明的,它要在数学的其他领域里以及别的自然科学领域里得到应用,而在这些场合里,我们时刻会碰到对无穷个集合的并集的测度的计算。我们必须在定义里就保证测度能够无穷相加。
  而是另一方面,为什么又偏偏要限制可数无穷个集合才有可加性呢?
  事实上,我们很容易就会发现,正是这一点促成了前面那个问题的出现:为什么线段具有长度?如果我们假设任意无穷个彼此不相交的子集的并集的测度等于这些子集各自测度之和,那么,既然线段是由无穷个点构成的而点又没有长度,那线段也应该没有长度才对。难道这一条是专门为了避免这个悖论才设置的么?
  不是。我们很快就能看到,这种对于可数性的限制,有着更为本质的原因存在。
  首先,让我们想想看把很多数相加是什么意思。我们一开始学到的加法是针对两个数而言的,给定任意两个数,我们能够算出它们的和。进而,我们把这一过程推广到了三个数求和:先对其中两者求和,然后再把这个和同第三者相加。依此类推,我们可以把四个数相加,把五个数相加……
  请注意,这里的过程完全是递归的(inductively):只有定义了n个数的和,我们才能够继而定义n+1个数的和。然后,这样一直进行下去,我们就能够对任意有限多个数求和。——只是“任意有限”,还不是“无限”。
  从有限到无限这一步跨越其实走得颇为艰难。哲学家也好别的领域的科学家也好常常随心所欲的使用数学词汇而并不特别在意自己是否真的明了它们的严格意义,可是数学家却不能如此自由。真正把无穷个数加起来,也就是数学中所谓的“级数”(series),这套理论的严密化在数学史上经历了相当长的一段时间。最终,借助于极限理论的帮助,真正严格的关于级数求和的理论才得以建立。——也就是说,事实上,什么样的无穷级数可以相加,什么时候不能相加,相加的时候要注意什么问题,这一切都受到了理论的约束。在这些理论的基础上,我们才能够确定当我们随口说出“把这无穷个数加在一起”的时候,我们确实知道我们在说什么。
  什么是级数呢?级数就是把有限个自然数相加的自然推广:既然定义了n个数的和我们就能够进而定义n+1个数的和,那么,把这个过程递归地进行下去,我们就能够对任意有限多个数求和。当有无穷个数需要我们求和的时候,我们就只对它们中的前N个求和,并且让这个N不断变大,如果这一过程有极限,这个极限就被我们称为这个无穷数的和。
  请注意上面这段话背后的涵义:当我们说“对无穷个数求和”的时候,我们其实潜在地要求了这些数的总个数必须能够通过n->n+1->n+2……这样的过程来逼近,然后通过极限的方式定义它们的和。这也就是说,这些数的总个数必须是可数个!
  让我们回忆一下什么是“可数个”:“可数个”就是能够和自然数集建立起一一对应的那么多个,用更直观的语言来说,“可数个”就是“可以一个一个数下去”的那么多个。只有一个集合里包含可数个元素的时候,我们才能够对于它应用数学归纳法,因为数学归纳法的本质就是“一个一个数下去”:当一件事对n成立时,我们进而要求它对n+1成立,这样的过程进行下去的极限,就是可数无穷。
  那么,既然多个数的加法本质上是个递归过程,——只有先把n个数加起来,我们才能进而加上第n+1个数,——所以加法至多能对“可数无穷”个数来定义(也就是级数加法)。把“不可数无穷个”数加在一起,这件事情是毫无意义的!
  这正是前面所有那些所谓哲学悖论的根源:当人们想当然的说着“把无穷个点的测度加在一起”的时候,他们以为他们是在说一件自然而然的事情,可是事实上,除非这无穷个点是可数个,否则这里的加法根本无法进行。不幸的是,任何线段都偏偏是由不可数个点构成的(它们是连续统)。
  为什么线段是由点构成的,而线段的测度却不等于组成它的那些点的测度之和?因为“组成它的那些点的测度之和”这个短语根本没有意义,所以两者也不必相等。
  这个回答也许有些出人意料,可是事情就是如此。很多问题之所以令人迷惑,不是因为它们真的是什么悖论,而只是因为问题本身没有被恰当的叙述。人们常常自以为是的使用很多词汇却罔顾自己是不是了解它们的真实含义,譬如说“求和”。人们随心所欲地说“把若干个数加在一起”却忘了其实不可能真的把它们“一下子”加在一起,加法是个递归过程,这就决定了如果要加的东西的个数太多(不可数那么多),它们就加不起来了。
  (不得不补充一点——一个很扫兴的补充——在数学中,某些场合下我们真的必须要对不可数个数定义总和……数学家总是这样,为了各种极端情况而拓展自己的定义。在这些情况下,这种不可数个数的和也是能定义出来的。但是,这件事并不会对上面那些论述造成削弱:这里的特殊意义上的“和”是为了应付特别的目的而定义的,它和我们平时所说的求和已经不是一个意思了。)
  也许哲学家还会追问:既然线段的测度不是组成它的那些点的测度之和,那么这个测度是从哪里来的呢?
  它们不是哪里来的……它们是线段自己所固有的。这就是为什么我们在定义长度的时候非要加上第三条公理的原因:我们必须在定义里就写明线段的测度,否则就没有办法建立起直线的所有可测子集的测度的架构。事实上,既然点的长度是零,根据可数可加性我们很容易推出一切可数集的长度也都是零,所以在某种意义上说来,“长度” 是本质上只属于连续统的一种性质。换句话说,只有进入了连续统的范畴,不为零的长度才可能出现。这就是为什么我们不能从单点集出发定义长度的原因。
  那么,我们现在可以回答那个著名的“飞矢不动”的悖论了:一支飞驰的箭,在每一个确定的时刻都静止在一个确定的位置上,为什么经过一段时间后会移动一段距离?
  答案是:因为任何一段时间(不管多么短暂)都是一个连续统,包含了不可数个时刻,所以箭在每一时刻的静止根本不需要对一整段时间之内的移动负责。——后者并不是前者的相加,而前者也根本不可能相加。
  因为连续统不可数,所以我们能够在每时每刻里都静止的存在,同时又能在一段时间内自由运动。这也许是大自然的巧妙安排吧。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值