博弈论（ICG）学习笔记

最新推荐文章于 2024-08-02 18:14:02 发布

Get the way of dream

最新推荐文章于 2024-08-02 18:14:02 发布

阅读量644

点赞数

分类专栏：笔记文章标签：算法

本文链接：https://blog.csdn.net/Tudou_Pika/article/details/127473397

版权

笔记专栏收录该内容

11 篇文章 0 订阅

订阅专栏

公平组合游戏 $(I CG)$

1、将一个局面看作一个点，决策看作出边，则一个游戏就是一个 $D A G$ 。

因为公平组合游戏具有有限性，所以无环。

在百度上对于 $I CG$ 的抽象模型是这样的（棋子游戏）： $D A G$ 的根上有一个棋子，两名选手交替沿有向边移动棋子，无法移动者判负。

2、 $N$ 和 $P$ 分别代表先手必胜与必败

一个局面为 $N$ 态的充要条件是有至少一条出边连接至 $P$ 态。

一个局面为 $P$ 态的充要条件是每一条出边都连接到 $N$ 态。

3、 $SG$ 函数

$SG$ 函数是在棋子游戏的 $D A G$ 上定义的（当然也可以当做在 $I CG$ 游戏的局面上定义）。

$E_{u}$ 表示结点（局面） $u$ 的出边。 $mex\{S\}$ 为集合 $S$ 中未出现的最小非负整数。

定义： $SG(u)=mex\{SG(v)|v\in E_{u}\}$

显然当 $E_{u}=\empty,SG(u)=0$ 。

下图是经典的一维跳棋的 $SG$ 值：

4、 $N im$ 游戏

有 $n$ 堆石子，两名选手轮流从任意一堆石子中取出任意多的石子。最终无法操作者判负。

容易发现一堆 $x$ 个石子的 $SG$ 函数值为 $x$ 。即 $SG (x) = x$ 。

为了方便书写，用 $T$ 表示 $⊕i=1nai \oplus_{i=1}^{n}a_{i}$

结论：当 $T = 0$ 时为 $P$ 态，反之为 $N$ 态。

证明这个结论，需要证明三个东西（即证明 $I CG$ 游戏里 $N, P$ 的充要条件成立）：

1、当 $a_{i}$ 全是0时（ $T = 0$ ）为 $P$ 态。显然（这是边界）。

2、若当前局面的 $T\neq 0$ （ $N$ ），则一定能转移到 $T = 0$ （ $P$ ）的局面。

对于这一条，考虑构造一次操作。既然 $T\neq 0$ ，那么 $T$ 肯定在二进制表示下有最高位（设为第 $k$ 位）的1。

这个1是由于奇数个**二进制表示下第 $k$ 位为1的 $a_{i}$ **计算异或和造成的。

那么想一想怎样才能转移到 $T = 0$ ，是让其中一堆由 $a_{i}$ 变为 $a_{i}\oplus T$ 。要求是 $a_{i}>a_{i}\oplus T$ 。

我们发现，对于上述二进制表示下第 $k$ 位为1的 $a_{i}$ ， $a_{i}>a_{i}\oplus T$ 。

所以让这样的 $a_{i}$ 去操作就可以了。

3、若当前局面的 $T = 0$ （ $P$ ），则无法转移到 $T = 0$ （ $P$ ）的局面。

由于异或的性质，这一条同样显然。

得证。

根据这三条，可以画出一（半）张 $N im$ 游戏的 $D A G$ ：

5、游戏的和

有 $n$ 个游戏，每轮玩家可以任选一个游戏进行一次决策，最后无法决策的人输。这个大游戏称为"游戏的和"。

$SG$ 定理：两个游戏 $u, v$ 构成的和的 $SG=SG(u)\oplus SG(v)$ 。

证明：

按照棋子游戏，就是有 $n$ 个棋子分别位于 $n$ 张 $D A G$ 的根上，两名选手交替沿有向边移动任意一个 $D A G$ 上的棋子，无法移动者判负。

想要证明这个定理，肯定要先理解一下一直处于理论的 $SG$ 函数的实际意义。

设 $SG (u) = k$ 。这说明 $mex\{SG(u)|v\in E_u\}=k$ ，也就是说对于任意 $i\in [0,k-1]$ ， $u$ 都存在一个后继 $v$ 使得 $SG (v) = i$ ，要不然 $SG (u)$ 就会等于 $i$ 了。

$N im$ 游戏告诉我们，局面 $u$ 的一个最优决策是将一个 $a_{i}$ 改为 $k$ ，而这个 $k\in [0,k-1]$ 。

并且在 $N im$ 游戏中，一堆大小为 $x$ 的石子的 $SG$ 值是 $x$ 。

这表明：如果将这 $n$ 枚棋子所在结点的 $SG$ 值看作 $n$ 堆对应大小的石子，那么这个 $N im$ 游戏的每个策略都对应原来这 $n$ 枚棋子的最优策略！

具体想想，设这 $n$ 枚棋子所在结点的 $SG$ 值为 $a_1,a_2...a_n)$ ，设一个局面为 $a_1,a_2...a_n)$ 的 $N im$ 游戏的最优决策是将 $a_j$ 改为 $k$ 。

那么原游戏的最优决策就是将第 $j$ 个棋子移到 $SG$ 值 $= k$ 的后继v。

根据 $N im$ 游戏的结论，得证。

6、 $Anti\_Nim$ 游戏

就是 $N im$ 游戏中最后操作的人失败。

用 $T$ 表示 $⊕i=1nai \oplus_{i=1}^{n}a_{i}$

结论：1、当全部 $a_{i}=1$ ，如果有奇数堆石子就为 $P$ 态，有偶数堆则为 $N$ 态。2、当至少一个 $a_{i}>1$ ， $T\neq 0$ 时为 $N$ 态，否则为 $P$ 态。

证明1：显然。

证明2：

情况 $A$ ：若只有一个 $a_{i}>1$ （此时 $T$ 一定 $\neq 0$ ） ，则先手选择转移到全部 $a_{i}=1$ 的局面，并且先手可以在这次决策中控制转移后堆数的奇偶。故这种情况 是 $N$ 态 。

情况 $B$ ：（不考虑 $T$ 取值）有至少2个 $a_{i}>1$ 。

小情况 $a$ ： $T\neq0$ ：通过 $N im$ 游戏可知一定能够转移到 $T = 0$ 的局面（小情况 $b$ ）。

小情况 $b$ ： $T = 0$ ：一方面可以转移到至少2个 $a_{i}>1,T\neq 0$ 的局面，即 $a$ 。另一方面随着游戏进行（ $a, b$ 循环），数量大于1的堆会逐渐减少，最终只剩一堆，这就变成了情况 $A$ ，为 $N$ 态。

观察情况 $B$ ， $b$ 能给对面 $N$ 态或至少2个 $a_{i}>1,T\neq 0$ 的局面，而 $a$ 仅能给对面 $T = 0$ 的局面。所以在情况 $B$ 下，小情况 $b$ 为 $N$ 态， $a$ 为 $P$ 态。也就是说当至少2个 $a_{i}>1,T\neq 0$ 时为N态，否则为 $P$ 态。