Part I Week 2：可枚举与不可枚举

最新推荐文章于 2024-04-19 11:22:30 发布

weixin_33755847

最新推荐文章于 2024-04-19 11:22:30 发布

阅读量587

点赞数

原文链接：http://blog.51cto.com/bodhicitta/1673130

版权

2.1 可枚举性

我们将要介绍一个涉及到集的大小的基本概念：可枚举（可数）集。

我们想当然的会认为一个只有几个元素的集合很小，有着一百个元素的集则挺大，规模为十亿的集就更加是伟哉大矣，而我们能想象大到极限的集合，可能就是一个拥有着无量元素的集。

然而从我们将要定义的理论来判断的话，一个像{1, 2, 3, ….} 这样的正整数无限集，实际上是相对而言算小的，数学上存在着无数多比它还大的集合！更确切地说，所有的有限集，以及有些无限集，是可数的(Countable)。不可数集比可数集要大，我们还是首先定义一下什么是可数集：

A set S is enumerable (akacountable) if there exists a function F : Z⁺→S that is onto.

一个集合S是可枚举的（即可数的），当且仅当存在一个从正整数到S的满射函数F

这样的一个满射方程F，我们称之为对S的枚举（Enumeration）

【注：即此函数式说明了存在一种S与正整数集的对应关系】

直觉性地去理解这个定义还可以这么来思考：想象正整数集是一本厚度无限的书（所以它有第一页但没有最后一页）。如果一个集能被“塞进”这本书的话，这是一个可数集。也就是说该集的所有元素都能出现在书的某一页上，且保证每一页只对应一个元素。那么显然的，有些无限集因此是可数的：比如Z⁺正整数集它本身。枚举函数可以是F(x)= x，第一页上写1，第二页上写2 ……

值得注意的是，枚举函数F是满射的，但不一定要是单射或全函数(totalfunction)：允许书本上出现空白页，也允许两页纸上写着同样的东西，这两种情况都不妨碍S是可枚举的，只要S不是“大”到容不进书里就足够了。

【注：即当我们一页页地翻开这本书的时候，我们最终可以遍历完该集，但不限制该集是用哪种规律、顺序呈现在书上的。首要保证的是“遍历”，所以以下的枚举是错误的：

1, 3, 5, 7 ……,2, 4, 6, 8 …..

从偶数部分开始，数字2出现在∞+1页，4出现在∞+2页……，而不是对于某个可准确赋值的数n，元素出现在n^th页上】

2.2 有木有另一种定义方式？

你可能会想，为什么不定义说当存在一个全函数F: S→Z⁺的时候，称S为可数的呢？原因是这样一来，就无法满足“枚举”这个概念的直观意义了。举个栗子：

Boolos → 1 左边的对应关系显然不是一个恰当的列举，因为Boolos和Burgess

Burgess → 1 被放到同一页了，而且从中无法判别他们的出现顺序。

Jeffrey → 2 而且这么做的话，会导致所有集都是可数集了，方法就是我们可以让任意集的所有元素，都和“1”对应……

【注：后面还有一小段篇幅都是在论证为什么从S到Z⁺的函数应该是满射的，而不需再说它是单射全函数之类的……其实从前面的书本比喻，就足够说明问题了，因此偷懒一下不再详述-w- …】

2.3 可数集的例子

先过一遍课本上7~14页的内容，以下是对于其中一些例子的补充说明

【注：课本是Compubabilityand Logic, BBJ，以下结合课本和NOTES】

Example 1.1

整数集：最简单的枚举方式是0, 1,-1, 2, -2…..，即f(1)= 0, f(2) = 1, f(3) = -1, f(4) = 2, f(5) = -2 ……当然还有很多的其他方法，比如f(1)不取零，或一次性列三个数再摆回负数部分等等。

Example 1.2

有序正整数对集：从这开始我们就可以初尝下神奇的康托尔对角线方法了！列举方式如左图

←水印....

算法：

For x in range 1 to infinity

Add (1,x) to the list

For y inrange 2 to x

For z in range 1 to x - 1

Add(y, z) to the list

【注：对角线方法能够保证我们总是能够遍历完这个矩阵上的每一个数字。因为这个方法不是等遍历完某一行/列后再开启下二行/列，巧妙的保证了算法的覆盖范围是全矩阵的，而且不会“卡死”在某一步而走不下去】

Example 1.3

正有理数集 The Set of positive rational numbers

需建立在有序正整数对集(ex1.2)的枚举基础上，我们把每一个正整数对(m,n)替换为一个有理数m/n，虽然这会导致有一大堆的冗余（比如2/2,3/3都是1），但不违背枚举函数的初衷J

【注：该例子也顺带证明了如果集合T是可数的，S是T的子集，那么S也是可数的。因为存在这么一种办法，可以把T的所有元素排到列表上，再把列表上所有和S等价的替换为S的元素】

Example 1.5

有序正整数三元组 The set of ordered Triples of positive integers

我们从有序正整数二元组的基础上出发，回顾一下对角线法给出的结果

L ={<1, 1>, <1, 2>, <2, 1>, <1, 3> .......}

如果把第二位上的数N，替换为L中的第N个元素，这将给出一个新的三元组<x,<y, z>>，如果对L中的每一个数做这样的替换，实际上就得出了所有正整数三元组的枚举。

但是我们还要再想一下为什么这个方法不会遗漏任何可能性。首先原来的对角线方法保证给出了所有的<1,x>、<2,x>、<3, x> ……那么以首位数为1的数列为例(<1,x>)，作了替换后，可以保证x会替换成所有的二元数组，也就是说保证列出了所有首位数为1的三元数组<1,y, z>。以此类推，可以列出所有首位为2的三元数组，首位为3的三元数组…

【注：用相似的证明方式，可以说明所有的有序N元数组都是可数的】

Example 1.9

正整数有限序列集 The set of finite sequences of positiveintegers

“长度为N的有限序列”等价于“有序N元组”。正整数有限序列集S是一个无限集，但它的每一个元素都是有限长度的，即一个有序N元组。证明S是可数的有两种方法：

1、还是对角线方法：

设想一个长宽无限的表格，所有一元组列在第一行，二元组列第二行……然后就在这张巨大的表格上从最左上角开始玩那扭曲的Z字爬行。

2、质数因子编码：

让p_n为第n个质数（因此p₁= 2, p₄ = 7, etc），对于每个序列s =（m_1,….., m_n），为其定义一个编码x↓

x =p₁^m1×…× p_n^mn

那么我们就可以定义一个函数是 F: X→S. 比如说，和序列(2, 4) 匹配的编码就是 2²×3⁴= 324，与序列(1,1, 1, 1)匹配的是2¹×3¹×5¹×7¹= 210

【注：由此可见，质数编码法给出的匹配x大多数是极大的数，但目前的理论阶段我们不考虑其效用问题，只要这个方法可行、结果是有限的就可以了】

接下来还要验证F是满射的（forall s∈S,there is a corresponding x∈X），并且F是合理的函数(iff(x_i) ≠ f(x_j),then x_i≠x_j)。前者是明显的，x的定义方式本身已经说明了这一点，每个序列都有一个匹配数x。所以我们主要看下后者，因为的确有如下的例子：

324 = 2²×3⁴= 2³×3²×5¹，看起来324可以反编码出(2,4)和(3,2 1)

感谢算数基本定理(Fundamental Theorem ofArithmetic)，我们永远不能从同一个x中，反编码出两个不同的序列J。基本定理说：每个大于1的自然数均可写为质数的积，而且这些素因子按大小排列之后，写法仅有一种方式。比如10只能表达为2×5而不是5×2，因为违背了质因子从小到大排列的规则。32只能表达为2×2×2×2×2=2⁵。那么我们回到刚才给出的例子，324的唯一质因子表达式是2²×3⁴，即反编码为序列(2,4)。

【注：因此只要result % p_i≠0，就不可以跳去尝试p_i+1，2³×3²×5¹违反了这一规定】

将F的定义域扩大到正整数集Z⁺的话，F就成为了我们的枚举函数，但注意因为XZ⁺，F不是全函数。虽然所有正整数都可以表达为唯一的质因子积，但不是所有的正整数都是某个数列的编码，比如10=2¹×3⁰×5¹，匹配序列(1,0, 1)并不是本例的正整数有限序列集的元素。所以“书本”的第十页是空白的，上面没有写着任何序列L。

Example 1.10

正整数有限集的集合 The set of finite sets ofpositive integer

既然我们已经在1.9中得到了正整数有限序列集的枚举方法，那么简单粗暴的把<x₁,x_{2 ….,}x_n> 改个符号变成{x₁,x₂, …., x_n} 就完事大吉啦~\(≧▽≦)/~ 虽然这会得出一个超级冗余的漫射函数。。比如<1,2>、<1,1, 2>、<2, 1>是不同的序列，但都对应同一个集合{1,2}……

【注：枚举函数F: Z⁺→Sequences → Sets】

2.4 可枚举性 vs. 有效可枚举性 Enumerability vs. Effective Enumerability

目前为止我们还只是在讨论一个集合是否是可枚举的（可数的），这是一个关乎集的大小的问题，即这个集合是否比自然数集有更多的元素。要满足一个集是可数的，我们只需要找到一个（当然，只存在于抽象概念上的）列出了所有元素的列表，但不需要给出生成这个列表的公式(recipeor formula for constructing the list)。当然了，给出一个有效的公式固然可以证明存在这么一个列表【注：如1.2中的算法】，但这不是证明的必要条件。

*现在我们开始设计到一个不同的概念：有效可枚举集合(effectively enumerable set)，这些集合的元素列表可以通过遵循某个算法(algorithm)来生成。那么是什么来区别可枚举和有效可枚举呢？这就是关乎集的复杂性(complexity)问题了，而不是集的大小(size)。

2.5 描述枚举的两个步骤 Two-step description ofenumerations

我们之前用到了这样一个逻辑：正有理数可以与正整数有序二元组，形成一一对应关系( m/n:= <m, n> ) 【注：即两者间存在一个双射函数bijection function】。我们又知道如何枚举所有正整数二元组，所以自然地正有理数也是可枚举的。再详细一些的话【注：感觉这里的描述累赘了。。。不知道为什么加入这一段】，为了说明有序二元组集S是可数的，我们需要展示存在一个从Z⁺到S的满射函数，再展示了正有理数V可与有序二元组配对后。这就证明了存在一个枚举复合函g·f: Z⁺→V，定义g: S→V 是双射函数

2.6. 等势 Equinumerosity

集合A与B是等势的当且仅当存在从A到B的双射函数

Two sets A and Bare said to be equinumerous if and only if there exists a bijection from A toB.

（这个也是“两个集同样大小”的精确定义）

由此衍生：

1、自等：任何集A是和自身等势的；

2、可交换：如果A与B等势，则B与A等势；

3、可传递：如果A与B等势，B与C等势

2.7. 不可数集 Not Enumerable Sets

【注：原NOTES中是为每一个例子开一个新section，方便起见将其整合到一起了，这些集的中文名字想不出如何翻译更好，看英文名直观很多】

我们已经见证了很多可数集，虽然它们当中的相当一部分当你首次接触到时，直觉上会认为它们肯定不可数。那么我们接下来便要看看真正的不可数集长什么样子。

正整数所有集合的集是不可数的（康托尔定理）

Theset of all sets of positive integer is not enumerable (Cantor’s Thereom)

首先要回忆的一个结论是：正整数有限集合的集是可数的（也就是这个集中的每个元素，都是一个正整数有限集，结论在1.10中推出）。但当它的规模扩充到可以包含无限集的时候，就成为了不可数集，这也是我们马上要来证明的：

我们的证明方法是归谬法(Reductio ad absurdum)，也就是首先假设正整数所有集合的集S存在一种枚举方式，然后由此得出一个矛盾结论 --- 于是证明了假设前提（存在S的枚举）是错误、不可能的。

【注：为了避免自己翻的中文名时不时恶心到自己，一律用S代表它吧 (╯﹏╰)】

假设列表L是S的枚举：

L = S₁,S_2,S₃ …

其中S₁,S_2,S₃ … 每一个S_i代表某个正整数集，L能够枚举所有的正整数集（包括有限和无限的），一切都还很美好。但这时定义一个新的正整数集△(L)：

△(L) = {n | n is not in S_n}

【注：也就是说，△(L)参考L里的每一个集，然后根据该集的内容来尝试为自己添加一个元素。当集S_n正好没有元素n时，△(L)就为自己添加这个对方没有的数"n"

假如:S₁ = {1, 3, 5, ….} 那么： △(L) = {} // 尝试失败，1是S1的元素

S₂ = {1, 4} = {2} // 尝试成功，2 ∈{1, 4}

S₃ = {1, 5} = {2, 3} // 尝试成功，3也被加入了△(L) 】

△(L)已经定义完毕，我们再回忆一下L是什么，L是一个包罗了正整数所有组合可能性的集，过去现在未来的所有元素是正整数的集，都是L的子集。那么自然的，△(L)也必然在L中有一席之地，所以我们假设存在一个m，使得S_m = △(L)。

于是瞬间L 就不好了(⊙o⊙) ：根据定义，仅当m不是S_m的元素时，m才能收录到△(L)，而现在S_m正好就是△(L)，结论就是“仅当m不是△(L)的元素时，m才是△(L)的元素”。简直天大的笑话……既然不可能的结论出现了，那么最初的假设肯定是错误的，也就是S不存在一个枚举L，S是不可数的！

正整数所有序列的集合是不可数的

The set ofall sequences of positive integers is not enumerable

现在我们考虑一个新的例子。首先还是确认一遍，正整数有限序列是可数的（结论在1.9中推出），但一旦它涉足到“无限”的大坑，或许下场就和上面的那位一样了。虽然这个结论其实很好得出，如果正整数所有序列的集合是可数的，那么我们马上就可以得出正整数所有集合的集也是可数的了（参考1.10的方法，<…>转换成{…}），但这已经证实是不可能的。但是为了介绍神奇的康托尔对角线方法(Techniqueof Diagonalization），我们可以先不管前面的经验，而去尝试直接证明；

同样是归谬法，假设L是正整数所有序列的集合S的枚举，则L_n是L中的n^th序列。这时定义一个新的序列△(L)：

△(L) 的n^th项等于L_n的n^th项加1，当L_n没有n^th项的时候，则直接取1。

Then^th element of △(L) is the positive integer which is 1 greater than the n^thelement of L_n(and is 1 if L_n has no n^th element).

即：

假如L的前三个序列是：1. <1,4,5,7,6,8,9,3,4,4,6,7,. . .> 则△(L)的前三项就是：2,5, 1

2. <2,4,4,6,7,1,3,5,8,9,4,5, . . .>

3. <2,4>

【注：如果我们考虑大大地拓展上面三个序列，并且通过为让有限序列添加特殊占位符B而让每一行都是无限长度，我们就得到了一个规模庞大的矩阵。比如沿用上面的例子的话前三列就是：

1. <1, 4,5,7,6,8,9,3,4,4,6,7, . . .> ←那么△(L)就是矩阵对角线上的每个数加

2. <2,4,4,6,7,1,3,5,8,9,4,5, . . .> 一，特殊情况是遇到B的时候，△(L)取一。

3. <2,4,B, B, B, B, B, B, B, …> △(L)可以说是从L自己身上衍生而来的一个“怪胎”】

…………

于是矛盾冉冉而生。既然L包罗了所有的正整数序列可能性，那么△(L)自然也不过是L的一个元素，假设L_m= △(L)。根据定义，△(L)的m^th与L_m的m^th不同，但L_m此时不是别的，正是△(L)自己！于是造成了△(L) ≠△(L)。同样的，正确的前提不可能导出错误的结论，我们的假设是错误的，S是不可数的L

实数集是不可数的

The set ofreal numbers is not enumerable

其实不必考虑浩瀚的实数范围，只考虑(0, 1)这个区间其实就足够了。比如0.10, 0.23123423…., 0.31415926….如果我们拿去前头的“0.”，那么小数部分可以看作是一个正整数序列。我们知道大于0小于1的数字可以是无穷精确的，因此数量无穷，最终我们得出的其实是一个包含一切可能性的正整数序列（是上面那位的亲兄弟），而正整数所有序列的集合已经证实为不可数。既然0到1之间的实数都“数不过来”，整个实数集也不可能是可数的L

2.10 有效过程EffectiveProcedures

如果一个过程(procedure)能够被一段有限的指令(instruction)所概述，那么我们称这个过程是有效的(effective)。

并且每个指令都满足以下三个特征：

1、机械的(mechanical) ：可以为通过计算机编程方式去执行它。

2、确定性的(deterministic) ：不像抛硬币，不会掺杂概率性【注：即逻辑正确的情况下，我们决定能够看到预期输出】

3、在有限时间内可达成(finitely achievable)：每个指令都在有限时间内执行完毕，不会一直运行到时间的尽头。

举个栗子，回忆一下我们小学时是如何做加法运算的。

166 ①：把两个数字向右对齐上下摆放。

+ 2124 <- ②：最开始从个位数开始，查询十以内的加法表

--------------------

3290 <- ③；如果该数位上加法结果小于10，那么直接写下结果在横线上。如果结果大于10，则把十位数上的数字进位。回到步骤②，但这次从下一位数开始计算，直到上下再也没有任何数字可以相加

以上就是这里所讲的“有效过程”，我们也为此写了一段运行此过程的指令（或曰步骤，当然这段指令还可以更严谨、精确），而且每一步指令都满足以上的三点要求：mechanical、deterministic、finitely achievable

这里需要注意两点。第一：因为每一步都是确定性的，以及每一步的步骤也被阐明在了过程中，不同的人只要正确遵循步骤都肯定能得出同样结果。第二：在一个有效过程中可能包含循环（比如加法中的②③），所以虽然单个的指令是有限时间内可达成的，但作为整体的过程，可能是一个永远无法停机的死循环……比如以下的这个有效过程：

①.输出1；跃进到步骤②

②.输出0；跃进到步骤①

2.11 可计算函数Computable functions

一个函数F:A→B是可计算的（或曰有效可计算 effectively computable），当且仅当存在这么一个有效过程：输入a∈A，输出f(a)∈B。

（我们允许一个偏函数partial function是可计算的。即当输入a∈A的时候，F无法提供任何与a的匹配，也就是说，F对于a这样的输入是未定义的。在这种情况下，要么F进入死循环，要么立刻停机而且不作任何输出）

然而目前为止，所谓的“有效过程”是一个直觉观念，我们给出的都还只是非正式定义，在数学意义上非常不精确。【注：而且看起来也不可能严格地被数学证明，正因如此，我们后面要接触到的丘奇-图灵论题还不能被称为定理，只能是假说】我们之后还会接触一些在数学意义上更严谨的、能够等价定义“可计算函数”的概念（图灵可计算函数、递归函数）。

------------------week2讲记翻译完毕 ---------------------

转载于:https://blog.51cto.com/bodhicitta/1673130

weixin_33755847

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
Part I Week 2：可枚举与不可枚举

2.1 可枚举性我们将要介绍一个涉及到集的大小的基本概念：可枚举（可数）集。我们想当然的会认为一个只有几个元素的集合很小，有着一百个元素的集则挺大，规模为十亿的集就更加是伟哉大矣，而我们能想象大到极限的集合，可能就是一个拥有着无量元素的集。然而从我们将要定义的理论来判断的话，一个像{1, 2, 3, ….} 这样的正整数无限集，实际上是相对而言算小的，数学上存在着无数多比...
复制链接

扫一扫