P、NP、NPC问题

最新推荐文章于 2022-10-30 21:44:29 发布

Cbird-coder

最新推荐文章于 2022-10-30 21:44:29 发布

阅读量1.3k

点赞数

分类专栏：数理逻辑与机器学习（machine Learning）

数理逻辑与机器学习（machine Learning）专栏收录该内容

1 篇文章 0 订阅

订阅专栏

via/点击打开链接

概念:在计算机学科中，存在多项式时间的算法的一类问题，称之为P类问题；而像梵塔问题、推销员旅行问题、（命题表达式）可满足问题这类，至今没有找到多项式时间算法解的一类问题，称之为NP类问题。1971年史提芬·古克（Stephen A. Cook）和Leonid Levin相对独立的提出了下面的问题，即是否两个复杂度类P和NP是恒等的（P=NP?）。
　　拿推销员旅行问题为例，假设推销员亨利有向6个城市推销公司产品的任务，并规定了一个旅行预算。他手中有一张航班票价表，他要从A城开始走遍图中的6个城市后返回A城，并且不超出预算，请你帮他找出应走的路线。如果给出的预算宽裕，则任务很简单；如果预算比较紧张，你就得认真设计路线了。你得考虑每一种可能的次序，以使旅费最少。
　　推销员旅行问题
如果有3个城市A，B和C，互相之间都有往返的飞机，而且起始城市是任意的，则有6种访问每个城市的次序：ABC,ACB,,BAC,BCA,CAB,CBA。如果有4个城市，则有24种次序，可以用阶乘来表示：4！=4×3！=4×3×2×1=24；若有5个城市，则有5！=5×4！=120，类似的有6！=720等等。即使用计算机来计算，这种急剧增长的可能性的数目也远远超过计算资源的处理能力，对此，算法复杂性专家史蒂芬.库克（Stephen Cook）评论："如果有100个城市，需要求出100！条路线的费用，没有哪一台计算机能够胜任这一任务。打个比方，让太阳系中所有的电子以它旋转的频率来计算，就算太阳烧尽了也算不完。问题的关键是某些东西在实践中行不通。"
而NP问题中最困难的问题称之为NP完全问题，已经证明的包括：电话网络的最优几何设计、格子棋的最佳走法。根据库克定理，任意一个NP完全问题如果能够在多项式时间内解决，则所有的NP问题都能在多项式时间内解决，而至今这一问题仍无答案。

如果一个问题可以找到一个能在多项式的时间里解决它的算法，那么这个问题就属于P问题。

NP问题是指可以在多项式的时间里验证一个解的问题。NP问题的另一个定义是，可以在多项式的时间里猜出一个解的问题。

NP问题不是网上所说的非P类问题。NP问题是指可以在多项式的时间里验证一个解的问题。NP问题的另一个定义是，可以在多项式的时间里猜出一个解的问题。比方说，我RP很好，在程序中需要枚举时，我可以一猜一个准。现在某人拿到了一个求最短路径的问题，问从起点到终点是否有一条小于100个单位长度的路线。它根据数据画好了图，但怎么也算不出来，于是来问我：你看怎么选条路走得最少？我说，我RP很好，肯定能随便给你指条很短的路出来。然后我就胡乱画了几条线，说就这条吧。那人按我指的这条把权值加起来一看，嘿，神了，路径长度98，比100小。于是答案出来了，存在比100小的路径。别人会问他这题怎么做出来的，他就可以说，因为我找到了一个比100 小的解。在这个题中，找一个解很困难，但验证一个解很容易。验证一个解只需要O(n)的时间复杂度，也就是说我可以花O(n)的时间把我猜的路径的长度加出来。那么，只要我RP好，猜得准，我一定能在多项式的时间里解决这个问题。我猜到的方案总是最优的，不满足题意的方案也不会来骗我去选它。这就是NP问题。当然有不是NP问题的问题，即你猜到了解但是没用，因为你不能在多项式的时间里去验证它。下面我要举的例子是一个经典的例子，它指出了一个目前还没有办法在多项式的时间里验证一个解的问题。

之所以要定义NP问题，是因为通常只有NP问题才可能找到多项式的算法。很显然，所有的P类问题都是NP问题。也就是说，能多项式地解决一个问题，必然能多项式地验证一个问题的解。

现在的焦点问题是：

人们想知道，是否所有的NP问题都是P类问题。我们可以再用集合的观点来说明。如果把所有P类问题归为一个集合P中，把所有NP问题划进另一个集合NP中，那么，显然有P属于NP。现在，所有对NP问题的研究都集中在一个问题上，即究竟是否有P=NP？通常所谓的“NP问题”，其实就一句话：证明或推翻P=NP。

人们普遍认为，P=NP不成立，也就是说，多数人相信，存在至少一个不可能有多项式级复杂度的算法的NP问题。人们如此坚信P≠NP是有原因的，就是在研究NP问题的过程中找出了一类非常特殊的NP问题叫做NP-完全问题，也即所谓的NPC问题。C是英文单词“完全”的第一个字母。正是NPC问题的存在，使人们相信P≠NP。

为说明NPC问题，引入一个概念——约化(Reducibility，有的资料上叫“归约”)。简单地说，一个问题A可以约化为问题B的含义即是，可以用问题B的解法解决问题A，或者说，问题A可以“变成”问题B。

《算法导论》上举了这么一个例子。比如说，现在有两个问题：求解一个一元一次方程和求解一个一元二次方程。那么我们说，前者可以约化为后者，意即知道如何解一个一元二次方程那么一定能解出一元一次方程。我们可以写出两个程序分别对应两个问题，那么我们能找到一个“规则”，按照这个规则把解一元一次方程程序的输入数据变一下，用在解一元二次方程的程序上，两个程序总能得到一样的结果。这个规则即是：两个方程的对应项系数不变，一元二次方程的二次项系数为0。按照这个规则把前一个问题转换成后一个问题，两个问题就等价了。

“问题A可约化为问题B”有一个重要的直观意义：B的时间复杂度高于或者等于A的时间复杂度。也就是说，问题A不比问题B难。这很容易理解。既然问题A能用问题B来解决，倘若B的时间复杂度比A的时间复杂度还低了，那A的算法就可以改进为B的算法，两者的时间复杂度还是相同。正如解一元二次方程比解一元一次方程难，因为解决前者的方法可以用来解决后者。约化具有一项重要的性质：约化具有传递性。如果问题A可约化为问题B，问题B可约化为问题C，则问题A一定可约化为问题C。

从约化的定义中看到，一个问题约化为另一个问题，时间复杂度增加了，问题的应用范围也增大了。通过对某些问题的不断约化，能够不断寻找复杂度更高，但应用范围更广的算法来代替复杂度虽然低，但只能用于很小的一类问题的算法。再回想前面讲的P和NP问题，联想起约化的传递性，如果不断地约化上去，不断找到能“通吃”若干小NP问题的一个稍复杂的大NP问题，那么最后是否有可能找到一个时间复杂度最高，并且能“通吃”所有的NP问题的这样一个超级NP问题？也就是说，存在这样一个NP问题，所有的NP问题都可以约化成它。换句话说，只要解决了这个问题，那么所有的NP问题都解决了。这种问题的存在难以置信，并且更加不可思议的是，这种问题不只一个，它有很多个，它是一类问题。这一类问题就是传说中的NPC问题，也就是NP-完全问题。NPC问题的出现使整个NP问题的研究得到了飞跃式的发展。NPC问题是最复杂的问题。人们想表达一个问题不存在多项式的高效算法时应该说它“属于NPC问题”。

NPC问题的定义非常简单。同时满足两个条件的问题就是NPC问题：

首先，它得是一个NP问题；

然后，所有的NP问题都可以约化到它。

证明一个问题是NPC问题也很简单。先证明它至少是一个NP问题，再证明其中一个已知的NPC问题能约化到它。既然所有的NP问题都能约化成NPC问题，那么只要任意一个NPC问题找到了一个多项式的算法，那么所有的NP问题都能用这个算法解决了，NP也就等于P了。给NPC找一个多项式算法太不可思议了。因此才说，“正是NPC问题的存在，使人们相信P≠NP”。可以就此直观地理解，NPC问题目前没有多项式的有效算法，只能用指数级甚至阶乘级复杂度的搜索。

顺便提一下NP-Hard问题。NP-Hard问题是这样一种问题，它满足NPC问题定义的第二条但不一定要满足第一条（就是说，NP-Hard问题要比NPC问题的范围广）。NP-Hard问题同样难以找到多项式的算法，它不一定是NP问题。即使NPC问题发现了多项式级的算法，NP-Hard问题有可能仍然无法得到多项式级的算法。事实上，由于NP-Hard放宽了限定条件，它将有可能比所有的NPC问题的时间复杂度更高从而更难以解决。

逻辑电路问题是NPC类问题的“鼻祖”。
    逻辑电路问题是指的这样一个问题：给定一个逻辑电路，问是否存在一种输入使输出为True。
    什么叫做逻辑电路呢？一个逻辑电路由若干个输入，一个输出，若干“逻辑门”和密密麻麻的线组成。看下面一例，不需要解释你马上就明白了。
  ┌───┐
  │ 输入1├─→┐    ┌──┐
  └───┘    └─→┤    │
                      │ or ├→─┐
  ┌───┐    ┌─→┤    │    │    ┌──┐
  │ 输入2├─→┤    └──┘    └─→┤    │
&
nbsp;└───┘    │                ┌─→┤AND ├──→输出
                └────────┘┌→┤    │
  ┌───┐    ┌──┐            │  └──┘
  │ 输入3├─→┤ NOT├─→────┘
  └───┘    └──┘
    这是个较简单的逻辑电路，当输入1、输入2、输入3分别为True、True、False或False、True、False时，输出为True。
    有输出无论如何都不可能为True的逻辑电路吗？有。下面就是一个简单的例子。
  ┌───┐
  │输入1 ├→─┐    ┌──┐
  └───┘    └─→┤    │
                    │AND ├─→┐
                ┌─→┤    │    │
                │    └──┘    │  ┌──┐
                │               └→┤   │
  ┌───┐    │                    │AND ├─→输出
  │输入2 ├→─┤   ┌──┐      ┌→ ┤   │
  └───┘    └→┤NOT ├→──┘     └──┘
                 └──┘
    上面这个逻辑电路中，无论输入是什么，输出都是False。我们就说，这个逻辑电路不存在使输出为True的一组输入。
    回到上文，给定一个逻辑电路，问是否存在一种输入使输出为True，这即逻辑电路问题。
    逻辑电路问题属于NPC问题。这是有严格证明的。它显然属于NP问题，并且可以直接证明所有的NP问题都可以约化到它（不要以为NP问题有无穷多个将给证明造成不可逾越的困难）。证明过程相当复杂，其大概意思是说任意一个NP问题的输入和输出都可以转换成逻辑电路的输入和输出（想想计算机内部也不过是一些 0和1的运算），因此对于一个NP问题来说，问题转化为了求出满足结果为True的一个输入（即一个可行解）。

/************************************下面几类问题************************************************/

1有解但无算法的问题：
    比如圆周率Pi的小数点后面是否有连续的100万个0。因为Pi是一个客观存在的实数，所以Pi的值是确定的，因此这个问题的解也是存在的。要么是yes,要么是no，虽然我们不知道他到底是什么，但他是客观存在的，不随时间改变，不随人的认识而改变。但是没有算法可以计算这个问题的答案。当然，可以用一种笨办法来解决这个问题，就是不停地计算Pi的小数点后面的值，如果发现了有连续的100万个0，则这个问题的答案就是yes，但是如果没有发现，我们必须一直计算下去，而且永远无法停止~~，所以这种苯办法根本称不上是算法，因为他不满足算法在有限步内终止的条件。所以这个问题是没有算法的（至少目前认为如此，也许以后可以从数论中找到某种方法来求出小数点后面是否有连续的k个0，或从概率的角度计算Pi的小数点后面的值的分布等等等等）。

2无解也无算法的问题：
  例如，给定任意一个命题，是否存在一种算法判断这个命题是真是假？这就是著名的图灵停机问题。如果存在这个算法，那么我们只要找到这个算法就可以一劳永逸了，以后无论拿到什么新的命题，都可以用这个算法来验证一下，立刻就知道该命题是真是假，这样我们就掌握了整个宇宙的终极真理）。但是图灵已经证明了这样的算法是不存在的，这个问题也是无解的。（证明中主要利用了康托尔对角线删除法，就是用来证明实数和自然数不等势的那种对角线删除法）

3可计算与不可计算：
根据图灵-丘奇论题，：
    1。可计算的问题就是能被图灵机计算的问题；（图灵的定义）
    2。可计算的问题就是使用lamda演算系统可以计算的问题；(丘奇的定义)
    图灵丘奇论题与其说是定理，不如说是算法的定义。因为算法本身就是一个不精确的概念，到底什么是算法，以前一直没有确切的定义。而图灵-丘奇论题则从数学上给出了算法的形式定义。
    图灵说：所有的图灵机能计算的问题都是有算法的（也就是可计算的），所有有算法的问题都可以用图灵机计算。这个论题本身是无法证明的，它就像物理中的光速不变定律一样，是一条自然定律，不能加以逻辑上的证明，只能用实验来检验。而目前来看，图灵命题也和光速不变一样，经得住历史和时间的检验，现在即使发展到了量子计算机，还是没有摆脱图灵机的约束，量子计算机上可计算的问题也是普通的图灵机上可计算的问题，只不过计算效率不同而已。

不可计算的问题的两个例子前面已经说过了，一个是Pi的例子，另一个是图灵停机问题。

4。可证明性与不可证明性
    在一个公理系统中，有若干条公理，有一些推导规则，在系统中进行定理的证明，就是从公理出发，利用这些规则推导出新的定理。如果最终能得到我们需要证明的命题，则该命题为真；如果最终得到了和我们需要证明的命题相违背的命题，则我们要证明的命题为假。

   如果把系统中所有的定理看作图中的节点，假如从定理i1,i2,..ik根据系统的规则可以推导出定理j，则从i1,i2,...ik分别连接一条到j的有向边。这样整个公理系统构造成了一个有向图。定理的证明过程事实上是在公理系统中从公理表示的节点出发，构造一颗到达目标命题节点的“证明树”。因而定理的证明就和图论中的路经搜索类似（BTW，这就是定理自动化证明的基本原理）。

   超级天才歌德尔在25岁的时候提出了著名的歌德尔不完备性定理。该定理指出：在任何一个公理化系统中，要么存在着矛盾，这个系统是不完备的。
    所谓存在着矛盾，就是可以证明命题A成立，也可以证明命题A的否命题成立，这就自相矛盾了。
    所谓不完备，是指系统中存在着一些命题，无法证明它成立，也无法证明它不成立。这就好像在一个图中存在着某些孤立点，从基本的公理节点出发永远无法访问到这些孤立点。

    歌德尔在“不完备性定理”的证明过程中构造出了一个无法证明是真是伪的定理。具体说起来比较麻烦，其简化为下述的简单形式：命题A = “命题A不成立”

    现在问命题A是否成立。如果命题A成立，则根据命题A的内容，命题A应该不成立；如果命题A不成立，则根据命题A的内容，命题A又应该成立。

   这个例子很不严谨，因为它事实上混淆了语法和语义层次，利用了逻辑中的悖论。

   罗素等人所提倡的解决这种悖论的方法就是给谓词逻辑分层次，从而产生了一阶谓词逻辑、二阶谓词逻辑等。像上面的例子，罗素认为命题A的内容描述了命题A本身的性质，这就超出了命题A所能表达的范围，他认为这样的A不是合法的命题。