acm博弈入门

转自:
http://www.cnitblog.com/weiweibbs/articles/42736.html
http://blog.csdn.net/luomingjun12315/article/details/45555495

一、博弈

所要讨论的博弈模型的特点:
1、博弈模型为两人轮流决策的非合作博弈。即两人轮流进行决策,并且两人都使用最优策略来获取胜利。
2、博弈是有限的。即无论两人怎样决策,都会在有限步后决出胜负。
3、公平博弈。即两人进行决策所遵循的规则相同。

二、胜态与必败态

博弈是一个动态的过程,我们对每个要做决策的局面进行分析,分成胜态和必败态。必败态就是无论怎么决策都会失败的局面。(显然每种局面进行决策后局面态势会发生变化。)胜态与必败态有以下属性:
1、若面临末状态者为获胜则末状态为胜态,否则末状态为必败态。
2、一个局面是胜态的(N)  <=> 该局面进行**某种**决策后会成为必败态。
3、一个局面是必败态(P)  <=> 该局面**无论**进行何种决策均会成为胜态。

也就是说,胜点经过决策可能到达必败点,而必败点一定由胜点进入。

二、三种博弈模型

以下部分来自xm学长的资料。

1.简单的动态博弈

A 和 B 在玩硬币游戏。给定 k 个数字 a1,a2,...,ak 一开始有 x 枚硬币, A 和 B 轮流取硬币。每次取硬币的数量一定要在 a1,a2,...,ak A 先取, 取走最后一枚的一方获胜。当双方都采取最优策略时,谁会获胜?假定 a1,a2,...,ak 一定有 1

2.Bash博弈

一堆物体,规定每次取物的个数为 [1,m]

3.Wythoff博弈

两堆物体,规定取物者每次从某堆或同时从两堆中取同样多的物品,至少取一个。
判断方法:
ak ≤bk,
ak = ⌊ k∗(1 +√5)/ 2 ⌋,bk = ak +k(k = 0,1,2,...,n)

4.Nim博弈

n 堆物体,规定取物者每次从某堆中至少取一个。
判断方法:
必胜态:a1 XOR a2 XOR...XOR an ̸= 0
必败态:a1 XOR a2 XOR...XOR an = 0

三、SG函数

1.SG-组合游戏

2.游戏图

    将组合游戏中的每一个状态抽象成图中的一个点,将每一步决 策抽象成图中的一条边。我们将这个图称为该组合游戏的游戏图。

3.SG 函数

SG 函数是对游戏图中每一个节点的评估函数。它的定义如下:

    f(v) = mex{f(u)|exist an edge from v to u} 
如若 x 有三个后继状态分别为 SG(a),SG(b),SG(c),那么SG(x) = mex{SG(a),SG(b),SG(c)}。
其中,mex()运算:
    是施加于一个集合的运算,表示最小的不属于这个集合的非负整数。例如mex{0,1,2,4}=3、mex{2,3,5}=0、mex{}=0。
SG函数性质:
    (1) 集合S 的终态(图中出度为0的点)必然是空集,所以SG函数的终态为 SG(x) = 0, x 为必败点P。
    (2) 对于任意的局面,如果它的 SG 值为 0,那么它的任何一个后继局面 的 SG 值不为 0。 
    (3) 对于任意的局面,如果它的 SG 值不为 0,那么它一定有一个后继局 面的 SG 值为 0。
【实例】取石子问题

有1堆n个的石子,每次只能取{ 1, 3, 4 }个石子,先取完石子者胜利,那么各个数的SG值为多少?
SG[0]=0,f [ ]={1,3,4}

x=1 时,可以取走1 - f{1}个石子,剩余{0}个,所以 SG[1] = mex{ SG[0] }= mex{0} = 1;
x=2 时,可以取走2 - f{1}个石子,剩余{1}个,所以 SG[2] = mex{ SG[1] }= mex{1} = 0;
x=3 时,可以取走3 - f{1,3}个石子,剩余{2,0}个,所以 SG[3] = mex{SG[2],SG[0]} = mex{0,0} =1;
x=4 时,可以取走4-  f{1,3,4}个石子,剩余{3,1,0}个,所以 SG[4] = mex{SG[3],SG[1],SG[0]} = mex{1,1,0} = 2;
x=5 时,可以取走5 - f{1,3,4}个石子,剩余{4,2,1}个,所以SG[5] = mex{SG[4],SG[2],SG[1]} =mex{2,0,1} = 3;
    以此类推.....

   x     0  1  2  3  4  5  6  7  8....

SG[x]    0  1  0  1  2  3  2  0  1....

由上述实例我们就可以得到SG函数值求解步骤,那么计算1~n的SG函数值步骤如下:

1、使用 数组f 将 可改变当前状态 的方式记录下来。
2、然后我们使用 另一个数组 将当前状态x 的后继状态标记。
3、最后模拟mex运算,也就是我们在标记值中 搜索 未被标记值 的最小值,将其赋值给SG(x)。
4、我们不断的重复 2 - 3 的步骤,就完成了 计算1~n 的函数值。

四、Anti-SG

1.Anti-SG游戏定义

1、决策集合为空的操作者胜。
2、其余规则与SG游戏一致。

2.SJ定理

对于任意一个Anti-SG游戏,如果定义所有子游戏的SG值为0时游戏结束,先手必胜的条件:
1、游戏的SG值为0且所有子游戏SG值均不超过1。
2、游戏的SG值不为0且至少一个子游戏SG值超过1。

目前就到此为止啦,只有些结论性的东西,听某人的话先去学会应用以后深入学习原理吧~

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值