Nim游戏博弈(收集完全版)

最新推荐文章于 2024-08-26 14:53:40 发布

幻月瑶琴

最新推荐文章于 2024-08-26 14:53:40 发布

阅读量2.3k

点赞数 2

分类专栏： ACM-博弈

ACM-博弈专栏收录该内容

10 篇文章 0 订阅

订阅专栏

Nim游戏的概述：

还记得这个游戏吗？

给出n列珍珠，两人轮流取珍珠，每次在某一列中取至少1颗珍珠，但不能在两列中取。最后拿光珍珠的人输。

后来，在一份资料上看到，这种游戏称为“拈（Nim）”。据说，它源自中国，经由被贩卖到美洲的奴工们外传。辛苦

的工人们，在工作闲暇之余，用石头玩游戏以排遣寂寞。后来

流传到高级人士，则用便士（Pennies），在酒吧柜台上玩。

最有名的玩法，是把十二枚便士放成3、4、5三列，拿光铜板的人赢。后来，大家发现，先取的人只要在3那列里取

走2枚，变成了1、4、5，就能稳操胜券了，游戏也就变得无趣

了。于是大家就增加列数，增加铜板的数量，这样就让人们有了毫无规律的感觉，不易于把握。

直到本世纪初，哈佛大学数学系副教授查理士•理昂纳德•包顿（Chales Leonard Bouton）提出一篇极详尽的分析

和证明，利用数的二进制表示法，解答了这个游戏的一般规则是规定拿光铜板的人赢。

它的变体是规定拿光铜板的人输，只要注意某种特殊形态（只有1列不为1），就可以了！

有很多人把这个方法写成计算机程序，来和人对抗，不知就理的人被骗得团团转，无不惊叹计算机的神奇伟大。其实

说穿了，只因为它计算比人快，数的转化为二进制其速度快得

非人能比，如此罢了。

（以上来自K12教育论坛）

Nim游戏的数学理论论述：

Nim游戏是博弈论中最经典的模型，它又有着十分简单的规则和无比优美的结论

Nim游戏是组合游戏(Combinatorial Games)的一种，准确来说，属于“Impartial Combinatorial Games”（以

下简称ICG）。满足以下条件的游戏是ICG（可能不太严谨）：1、有两名选手；2、两名选手交替对游戏进行移动

(move)，每次一步，选手可以在（一般而言）有限的合法移动集合中任选一种进行移动；3、对于游戏的任何一种可

能的局面，合法的移动集合只取决于这个局面本身，不取决于轮到哪名选手操作、以前的任何操作、骰子的点数或者

其它什么因素； 4、如果轮到某名选手移动，且这个局面的合法的移动集合为空（也就是说此时无法进行移动），则

这名选手负。根据这个定义，很多日常的游戏并非ICG。例如象

棋就不满足条件3，因为红方只能移动红子，黑方只能移动黑子，合法的移动集合取决于轮到哪名选手操作。

通常的Nim游戏的定义是这样的：有若干堆石子，每堆石子的数量都是有限的，合法的移动是“选择一堆石子并

拿走若干颗（不能不拿）”，如果轮到某个人时所有的石子

堆都已经被拿空了，则判负（因为他此刻没有任何合法的移动）。

这游戏看上去有点复杂，先从简单情况开始研究吧。如果轮到你的时候，只剩下一堆石子，那么此时的必胜策略肯定

是把这堆石子全部拿完一颗也不给对手剩，然后对手就输了。

如果剩下两堆不相等的石子，必胜策略是通过取多的一堆的石子将两堆石子变得相等，以后如果对手在某一堆里拿若

干颗，你就可以在另一堆中拿同样多的颗数，直至胜利。如果你面对的是两堆相等的石子，那么此时你是没有任何必

胜策略的，反而对手可以遵循上面的策略保证必胜。如果是三堆石子……好像已经很难分析了，看来我们必须要借助

一些其它好用的（最好是程式化的）分析方法了，或者说，我们最好能够设计出一种在有必胜策略时就能找到必胜策

略的算法。

定义P-position和N-position，其中P代表Previous，N代表Next。直观的说，上一次move的人有必胜策略的

局面是P-position，也就是“后手可保证必胜”或者“先手必败”，现在轮到move的人有必胜策略的局面是N-position，也就是“先手可保证必胜”。更严谨的定义是：1.无法进行任何移动的局面（也就是terminal

position）是P-position；2.可以移动到P-position的局面是N-position；3.所有移动都导致N-position

的局面是P-position。

按照这个定义，如果局面不可能重现，或者说positions的集合可以进行拓扑排序，那么每个position或者是P-

position或者是N-position，而且可以通过定义计算出来。

以Nim游戏为例来进行一下计算。比如说我刚才说当只有两堆石子且两堆石子数量相等时后手有必胜策略，也就是这

是一个P-position，下面我们依靠定义证明一下(3,3)是一个P是一个P-position。首先(3,3)的子局面（也就是通过

合法移动可以导致的局面）有(0,3)(1,3)(2,3)（显然交换石子堆的位置不影响其性质，所以把(x,y)和(y,x)看成同

一种局面），只需要计算出这三种局面的性质就可以了。 (0,3)的子局面有(0,0)、(0,1)、(0,2)，其中(0,0)显然是

P-position，所以(0,3)是N-position（只要找到一个是P-position的子局面就能说明是N-position）。(1,3)的后继

中(1,1)是P-position（因为(1,1)的唯一子局面(0,1)是N-position），所以(1,3)也是N-position。同样可以证明

(2,3)是N-position。所以(3,3)的所有子局面都是N-position，它就是P-position。通过一点简单的数学归纳，可以

严格的证明“有两堆石子时的局面是P-position当且仅当这两堆石子的数目相等”。

根据上面这个过程，可以得到一个递归的算法——对于当前的局面，递归计算它的所有子局面的性质，如果存在某个

子局面是P-position，那么向这个子局面的移动就是必胜策略。当然，可能你已经敏锐地看出有大量的重叠子问题，

所以可以用DP或者记忆化搜索的方法以提高效率。但问题是，利用这个算法，对于某个Nim游戏的局(a1,a2,...,an)

来说，要想判断它的性质以及找出必胜策略，需要计算O(a1*a2*...*an)个局面的性质，不管怎样记忆化都无法降低

这个时间复杂度。所以我们需要更高效的判断Nim游戏的局面的性质的方法。

直接说结论好了。

(Bouton's Theorem)：对于一个Nim游戏的局面(a1,a2,...,an)，它是P-position当且仅当a1^a2^...^an=0，其中^表示异或(xor)运算。

怎么样，是不是很神奇？我看到它的时候也觉得很神奇，完全没有道理的和异或运算扯上了关系。但这个定理的证明

却也不复杂，基本上就是按照两种position的证明来的。

根据定义，证明一种判断position的性质的方法的正确性，只需证明三个命题： 1、这个判断将所有terminal

position判为P-position；2、根据这个判断被判为N-position的局面一定可以移动到某个P-position；3、根据这个

判断被判为P-position的局面无法移动到某个P-position。

第一个命题显然，terminal position只有一个，就是全0，异或仍然是0。

第二个命题，对于某个局面(a1,a2,...,an)，若a1^a2^...^an!=0，一定存在某个合法的移动，将ai改变成ai'后满

足a1^a2^...^ai'^...^an=0。不妨设a1^a2^...^an=k，则一定存在某个ai，它的二进制表示在k的最高位上是

1（否则k的最高位那个1是怎么得到的）。这时ai^k<ai一定成立。则我们可以将ai改变成ai'=ai^k，

此时a1^a2^...^ai'^...^an=a1^a2^...^an^k=0。

第三个命题，对于某个局面(a1,a2,...,an)，若a1^a2^...^an=0，一定不存在某个合法的移动，将ai改变成ai'后

满足a1^a2^...^ai'^...^an=0。因为异或运算满足消去率，由a1^a2^...^an=a1^a2^...^ai'^...^an可以得

到ai=ai'。所以将ai改变成ai'不是一个合法的移动。证毕。

根据这个定理，我们可以在O(n)的时间内判断一个Nim的局面的性质，且如果它是N-position，也可以在O(n)的时

间内找到所有的必胜策略。Nim问题就这样基本上完美的解决了。

（以上来自百度百科）

Nim游戏的形象具体论述：

Nim取子游戏是由两个人面对若干堆硬币（或石子）进行的游戏。设有k>=1堆硬币，各堆分别含有N₁，N₂，……N_K枚硬币。游戏的目的就是选择最后剩下的硬币。游戏法则如下：

1．两个游戏人交替进行游戏（游戏人I和游戏人II）；

2．当轮到每个游戏人取子时，选择这些堆中的一堆，并从所选的堆中取走至少一枚硬币（游戏人可以取走他所选

堆中的全部硬币）；

3．当所有的堆都变成空堆时，最后取子的游戏人即为胜者。

这个游戏中的变量是堆数k和各堆的硬币数N₁，N₂，……N_k。对应的组合问题是，确定游戏人I获胜还是游戏人II

获胜以及两个游戏人应该如何取子才能保证自己获胜（获胜策略）。

为了进一步理解Nim取子游戏，我们考查某些特殊情况。如果游戏开始时只有一堆硬币，游戏人I则通过取走所有

的硬币而获胜。现在设有2堆硬币，且硬币数量分别为N₁和 N ₂ 。游戏人取得胜利并不在于N1和N2的值具体是多少，而是取决于它们是否相等。设N ₁ ！=N ₂ ，游戏人I从大堆中取走的硬币使得两堆硬币数量相等，于是，游戏人 I以后每次取子的数量与游戏人II相等而最终获胜。但是如果N ₁ = N ₂ ，则：游戏人II只要按着游戏人I取子的数量在另一堆中取相等数量的硬币，最终获胜者将会是游戏人II。这样，两堆的取子获胜策略就已经找到了。

现在我们如何从两堆的取子策略扩展到任意堆数中呢？

首先来回忆一下，每个正整数都有对应的一个二进制数，例如：57₍₁₀₎à 111001₍₂₎ ，即： 57₍₁₀₎=2⁵+2⁴+2³+2⁰。于是，我们可以认为每一堆硬币数由2的幂数的子堆组成。这样，含有57枚硬币大堆就能

看成是分别由数量为2 ⁵ 、2 ⁴ 、2 ³ 、2 ⁰ 的各个子堆组成。

现在考虑各大堆大小分别为N₁，N₂，……N_k的一般的Nim取子游戏。将每一个数N_i表示为其二进制数（数的位数相等，不等时在前面补0）：

N₁= a_s…a₁a₀

N₂= b_s…b₁b₀

……

N_k= m_s…m₁m₀

如果每一种大小的子堆的个数都是偶数，我们就称Nim取子游戏是平衡的，而对应位相加是偶数的，称为平衡

位否则称为非平衡位。因此，Nim取子游戏是平衡的，当且仅当：

a_s+ b_s + … + m_s 是偶数

……