博弈论总结

博弈论总结(其实就是整合一下资料,定义性质的东西较多,自己也写不出来...):

由浅入深的看了一天的博弈论的博客,大概了解了一下博弈论。一开始认为只要会了三个基础博弈就完成了博弈论,后来在看题的时候又延伸出来一些东西,才知道没那么简单。但也不是多难的东西吧,虽然可能是我还没看到很难的东西。

那么博弈论究竟做了什么呢,它围绕ICG游戏的各种变式构造了一个可以判定某状态下胜负的SG函数,嗯,好像就怎么多。也就是说关键是在于这个SG函数,而那三个基础的博弈都是可以由这个SG函数推导出来。

由于是总结性质的博客,就不按照三个基础博弈加SG函数的顺序说的那么细了。

首先,ICG游戏的基础模型是给定一个有向无环图和一个起始顶点上的一枚棋子,两名选手交替的将这枚棋子沿有向边进行移动,无法移动者判负。在这个游戏里存在着三态,P态(P-position),简而言之先手必败,N态(N-position),也就是先手必胜,以及Terminal position,无法进行任何移动的局面。且P-N-T三个状态满足如下关系:

1).无法进行任何移动的局面(也就是Terminal position)是P-position;

2).可以移动到P-position的局面是N-position;

3).所有移动都导致N-position的局面是P-position。

2、P/N状态有如下性质:

1)、若面临末状态者为获胜则末状态为胜态否则末状态为必败态。

2)、一个局面是胜态的充要条件是该局面进行某种决策后会成为必败态。

3)、一个局面是必败态的充要条件是该局面无论进行何种决策均会成为胜态

3、P点: 即必败点,某玩家位于此点,只要对方无失误,则必败;

   N点: 即必胜点,某玩家位于此点,只要自己无失误,则必胜。

(以上关于P-N-T态的关系摘自:http://blog.csdn.net/lgdblue/article/details/15809893

而后在游戏的各个顶点上定义了SG函数:

首先定义mex(minimal excludant)运算,这是施加于一个集合的运算,表示最小的不属于这个集合的非负整数。例如mex{0,1,2,4}=3、mex{2,3,5}=0、mex{}=0。

定义关于图的每个顶点的Sprague-Garundy函数g如下:g(x)=mex{ g(y) | y是x所能到达的状态点}。

SG函数的性质:

首先,所有的Terminal position所对应的顶点,也就是没有出边的顶点,其SG值为0,因为它的后继集合是空集。然后对于一个g(x)=0的顶点x,它的所有后继y都满足 g(y)!=0。对于一个g(x)!=0的顶点,必定存在一个后继y满足g(y)=0。

以上这三句话表明,顶点x所代表的postion是P-position当且仅当g(x)=0(跟P-positioin/N-position的定义的那三句话是完全对应的)。我们通过计算有向无环图的每个顶点的SG值,就可以对每种局面找到必胜策略了。

而后满足若干子游戏的SG值的异或结果为主游戏的SG值

这样说可能有些抽象,于是去看三个基础博弈:

一.巴什博弈:

首先基于游戏:一堆数量为n的物品里面选物品,一次选1-m个,这样0-m的SG函数值:g(0)=0,g(1)=1,g(2)=2,......,g(m)=m,然后g(m+1)=0(因为从m+1能到达的状态只能是1-m,其中没出现过的最小的非负整数为0,以此类推,发现是一个m+1的循环节,处于k*(m+1)位置处的g始终为0,也就是先手必败的位置。对于这个结果一个比较有趣的解释就是:

如果n=(m+1)r+s,(r为任意自然数,s≤m,即s=n%(m+1))。当s>0时肯定是先手胜。因为先手只要事先取s,之后若后手取x,则先手取m+1-x即可,最终一定是后手胜利。这个问题反映出解决博弈论问题的一个很好的思路,那就是逆推归纳法。从一个必胜或必败的局势出发进行逆推,最终得到一个普遍适用的结论。

但最终都可以用SG函数解释。

二.威佐夫博弈:

基于游戏:两堆物品里面选物品,假设一堆为n,一堆为m,每次可以从一堆里面拿走任意个数个物品,或者从两堆里面拿走等量的物品,最后拿光的为胜者,其SG函数值见《信息学奥赛之数学一本通》,最终得结论:

我们有如下公式:

ak =[k(1+√5)/2],bk= ak + k  (k=0,1,2,…,n 方括号表示取整函数)

其中(ak,bk)所表示的局势为奇异局势。

三. NIM博弈:

基于游戏:从若干堆物品里面挑选,一次可以从任意一堆物品里面拿任意个数个物品,但是不能小于1个,最后拿光者为胜。其可以看作若干巴什博弈的组合,其中m=n,而后SG的值为所有的异或,若为0,则为败态。也可以通过证明命题转化得到。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值