acm博弈入门

最新推荐文章于 2020-10-03 17:29:16 发布

WeSeewe_Wy

最新推荐文章于 2020-10-03 17:29:16 发布

阅读量302

点赞数 1

分类专栏：博弈和组合游戏学习笔记文章标签： acm 博弈组合游戏

博弈和组合游戏同时被 2 个专栏收录

5 篇文章 0 订阅

订阅专栏

学习笔记

4 篇文章 0 订阅

订阅专栏

转自：
http://www.cnitblog.com/weiweibbs/articles/42736.html
http://blog.csdn.net/luomingjun12315/article/details/45555495

一、博弈

所要讨论的博弈模型的特点：
1、博弈模型为两人轮流决策的非合作博弈。即两人轮流进行决策，并且两人都使用最优策略来获取胜利。
2、博弈是有限的。即无论两人怎样决策，都会在有限步后决出胜负。
3、公平博弈。即两人进行决策所遵循的规则相同。

二、胜态与必败态

博弈是一个动态的过程，我们对每个要做决策的局面进行分析，分成胜态和必败态。必败态就是无论怎么决策都会失败的局面。(显然每种局面进行决策后局面态势会发生变化。)胜态与必败态有以下属性：
1、若面临末状态者为获胜则末状态为胜态，否则末状态为必败态。
2、一个局面是胜态的(N)  <=> 该局面进行**某种**决策后会成为必败态。
3、一个局面是必败态(P)  <=> 该局面**无论**进行何种决策均会成为胜态。

也就是说，胜点经过决策可能到达必败点，而必败点一定由胜点进入。

二、三种博弈模型

以下部分来自xm学长的资料。

1.简单的动态博弈

A 和 B 在玩硬币游戏。给定 k 个数字 a1,a2,...,ak 一开始有 x 枚硬币， A 和 B 轮流取硬币。每次取硬币的数量一定要在 a1,a2,...,ak A 先取， 取走最后一枚的一方获胜。当双方都采取最优策略时，谁会获胜？假定 a1,a2,...,ak 一定有 1

2.Bash博弈

一堆物体，规定每次取物的个数为 [1,m]

3.Wythoff博弈

两堆物体，规定取物者每次从某堆或同时从两堆中取同样多的物品，至少取一个。

判断方法：

ak ≤bk,
ak = ⌊ k∗(1 +√5)/ 2 ⌋,bk = ak +k(k = 0,1,2,...,n)

4.Nim博弈

n 堆物体，规定取物者每次从某堆中至少取一个。

判断方法：

必胜态：a1 XOR a2 XOR...XOR an ̸= 0
必败态：a1 XOR a2 XOR...XOR an = 0

三、SG函数

1.SG-组合游戏

2.游戏图

    将组合游戏中的每一个状态抽象成图中的一个点，将每一步决 策抽象成图中的一条边。我们将这个图称为该组合游戏的游戏图。

3.SG 函数

SG 函数是对游戏图中每一个节点的评估函数。它的定义如下：

    f(v) = mex{f(u)|exist an edge from v to u} 
如若 x 有三个后继状态分别为 SG(a),SG(b),SG(c)，那么SG(x) = mex{SG(a),SG(b),SG(c)}。

其中，mex()运算：

    是施加于一个集合的运算，表示最小的不属于这个集合的非负整数。例如mex{0,1,2,4}=3、mex{2,3,5}=0、mex{}=0。

SG函数性质：

    (1) 集合S 的终态（图中出度为0的点）必然是空集，所以SG函数的终态为 SG(x) = 0, x 为必败点P。
    (2) 对于任意的局面，如果它的 SG 值为 0，那么它的任何一个后继局面 的 SG 值不为 0。 
    (3) 对于任意的局面，如果它的 SG 值不为 0，那么它一定有一个后继局 面的 SG 值为 0。

【实例】取石子问题

有1堆n个的石子，每次只能取{ 1, 3, 4 }个石子，先取完石子者胜利，那么各个数的SG值为多少？
SG[0]=0，f [ ]={1,3,4}

x=1 时，可以取走1 - f{1}个石子，剩余{0}个，所以 SG[1] = mex{ SG[0] }= mex{0} = 1;
x=2 时，可以取走2 - f{1}个石子，剩余{1}个，所以 SG[2] = mex{ SG[1] }= mex{1} = 0;
x=3 时，可以取走3 - f{1,3}个石子，剩余{2,0}个，所以 SG[3] = mex{SG[2],SG[0]} = mex{0,0} =1;
x=4 时，可以取走4-  f{1,3,4}个石子，剩余{3,1,0}个，所以 SG[4] = mex{SG[3],SG[1],SG[0]} = mex{1,1,0} = 2;
x=5 时，可以取走5 - f{1,3,4}个石子，剩余{4,2,1}个，所以SG[5] = mex{SG[4],SG[2],SG[1]} =mex{2,0,1} = 3;
    以此类推.....

   x     0  1  2  3  4  5  6  7  8....

SG[x]    0  1  0  1  2  3  2  0  1....

由上述实例我们就可以得到SG函数值求解步骤，那么计算1~n的SG函数值步骤如下：

1、使用数组f 将可改变当前状态的方式记录下来。
2、然后我们使用另一个数组将当前状态x 的后继状态标记。
3、最后模拟mex运算，也就是我们在标记值中搜索未被标记值的最小值，将其赋值给SG(x)。
4、我们不断的重复 2 - 3 的步骤，就完成了计算1~n 的函数值。

四、Anti-SG

1.Anti-SG游戏定义

1、决策集合为空的操作者胜。
2、其余规则与SG游戏一致。

2.SJ定理

对于任意一个Anti-SG游戏，如果定义所有子游戏的SG值为0时游戏结束，先手必胜的条件：
1、游戏的SG值为0且所有子游戏SG值均不超过1。
2、游戏的SG值不为0且至少一个子游戏SG值超过1。

目前就到此为止啦，只有些结论性的东西，听某人的话先去学会应用以后深入学习原理吧~

WeSeewe_Wy

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
acm博弈入门

转自： http://www.cnitblog.com/weiweibbs/articles/42736.html http://blog.csdn.net/luomingjun12315/article/details/45555495一、博弈所要讨论的博弈模型的特点：1、博弈模型为两人轮流决策的非合作博弈。即两人轮流进行决策，并且两人都使用最优策略来获取胜利。2、博弈是有
复制链接

扫一扫

专栏目录