Stone Game(取石子游戏的三类博弈)

此类问题一般有如下特点:
     1、 博弈模型为两人轮流决策的非合作博弈。即两人轮流进行决策,并且两人都使用最优策略来获取胜利。
     2、 博弈是有限的。即无论两人怎样决策,都会在有限步后决出胜负。
     3、 公平博弈。即两人进行决策所遵循的规则相同。
 本着先理论后实践的原则,本文先对"寻找必败态"做出理论上的解释:
     要理解这种思想,首先要明白什么叫必败态。说简单点,必败态就是 "在对方使用最优策略时,无论做出什么决策都会导致失败的局面"。其他的局面称为胜态,值得注意的是 在胜态下做出错误的决策也有可能导致失败。此类博弈问题的精髓就是 让对手永远面对必败态。
     必败态和胜态有着如下性质:
     1、 若面临末状态者为获胜则末状态为胜态否则末状态为必败态。
     2、 一个局面是胜态的充要条件是该局面进行某种决策后会成为必败态。
     3、 一个局面是必败态的充要条件是该局面无论进行何种决策均会成为胜态
     这三条性质正是博弈树的原理,但博弈树是通过计算每一个局面是胜态还是必败态来解题,这样在局面数很多的情况下是很难做到的,此时,我们可以利用人脑的推演归纳能力找到必败态的共性,就可以比较好的解决此类问题了。

(一)巴什博弈(Bash Game):只有一堆n个物品,两个人轮流从这堆物品中取物,规定每次至少取一个,最多取m个。最后取光者得胜。

很容易想到当n%(m+1)<>0时,先取必胜,第一次先拿走n%(m+1),以后每个回合到保持两人拿走的物品总和为m+1即可。

这个游戏还可以有一种变相的玩法:两个人轮流报数,每次至少报一个,最多报十个,谁能报到100者胜。

 

(二)威佐夫博弈(Wythoff Game):有两堆各若干个物品,两个人轮流从某一堆或同时从两堆中取同样多的物品,规定每次至少取一个,多者不限,最后取光者得胜。

如果甲面对(00),那么甲已经输了,这种局势我们称为奇异局势。前几个奇异局势是:(00)、(12)、(35)、(47)、(610.可以看出,a0=b0=0,ak是未在前面出现过的最小自然数, bk=ak+k.

    那么任给一个局势(ab),怎样判断它是不是奇异局势呢?我们有如下公式:

    ak =[k1+5/2]bk= ak + k  k=012...,n 方括号表示取整函数)

奇妙的是其中出现了黄金分割数(1+5/2 = 1618...,因此,akbk组成的矩形近似为黄金矩形,由于2/1+5=(√5-1/2,可以先求出j=[a(√5-1/2],若a=[j1+5/2],那么a = ajbj = aj + j,若不等于,那么a = aj+1bj+1 = aj+1+ j + 1,若都不是,那么就不是奇异局势。然后再按照上述法则进行,一定会遇到奇异局势。

POJ1067 取石子游戏

#include<iostream>

using namespace std;

int main()

{

       int k,n,m;

       double r=0.6180339887,R=1/r;

       while (scanf("%d%d",&n,&m)+1)

       {

              if (n>m)

              {

                     k=n;

                     n=m;

                     m=k;

              }

              k=n*r;

              if (n!=(int)(k*R))

                     ++k;

              printf("%d/n",m!=(int)(k*R)+k);

       }

       return 0;

}

 

(三)尼姆博弈(Nimm Game):有三堆各若干个物品,两个人轮流从某一堆取任意多的物品,规定每次至少取一个,多者不限,最后取光者得胜。

对于任何奇异局势(a,b,c),都有a^b^c=0.

非奇异局势(a,b,c)(a<b<c)转换为奇异局势,只需将c变为a^b,即从c中减去 c-(a^b)即可。

 

POJ2234 Matches Game

#include<iostream>

using namespace std;

int main()

{

       int i,k,n;

       while (scanf("%d",&n)+1)

       {

              for (k=0;n--;)

              {

                     scanf("%d",&i);

                     k^=i;

              }

              if (k)

                     printf("Yes/n");

              else

                     printf("No/n");

       }

       return 0;

}

 

取石子游戏相关题目:POJ1704 Georgia and Bob  POJ1740 A New Stone Game 


1067

于是我反转思路,干脆从性质入手。
      我们令必败二元组为(a,b)形式,并令a      根据性质三,有这样两个推论:
      推论一:对于任意两个的必败二元组(a1,b1),(a2,b2),有a1<>a2,b1<>b2,a1<>b2,a2<>b1。
      推论二:对于任意两个的必败二元组(a1,b1),(a2,b2),有b1-a1<>b2-a2。
      利用性质和该推论,我们证明如下结论:"将必败二元组按首元为关键字排序,每个必败二元组中首元为未在前面的必败二元组中出现的最小正整数,并且第N组中两个数差为N"。
      利用数学归纳法证明:
      第一组为(1,2),满足题意。
      若前N组满足题意,则有:
      设为在前N组中未出现的最小正整数为M,则对于二元组(M,M+N+1)有: 
      如果从数量为M的堆中取了石子,不妨设变成了(K,L),则L-K>N,这样就有一个包含K,且不与前面N组任何一组相同的二元组,根据推论一,这个二元组一定不是必败二元组。
      如果只从数量为M+N+1的堆中取,不妨设剩下K颗。
      由于M是前面未出现的最小的数,所以不可能以前面的任何必败二元组相同。
      综上,根据性质三,(M,M+N+1)为必败二元组,又根据排序的法则,(M,M+N+1)一定是数列的第(N+1)项。证毕。
 虽然有了上面的证明但是还是不能说明本题的必败太就是上面说的情况,还有证明,其他的任何一个状态都可以通过一次操作变成一个必败的状态。
本游戏的安全组合序列如下(后手胜),先手可以通过构造这些安全状态达到胜利。
(1, 2)
(3, 5)
(4, 7)
(6, 10)
(8, 13)
(9, 15)
(11, 18)
(12, 20)
……

考察序列,可发现如下性质
1. 1,2,3,4……每个正整数都正好出现且只出现1次
2. 序列中每对正整数之差,次序为1,2,3,4……
3. 一般表达式为([a·r], [b·r]),其中,a=(sqrt(5)+1)/2,b=(sqrt(5)+3)/2=(sqrt(5)+1)/2+1=a+1
4. a与b恰为黄金分割X=(sqrt(5)-1)/2=0.618和 1/X同1之和。即a=1+X,b=1+1/X。
 
#include 
#include
int main ()
{
    int a, b;
    int k, c;
    while ( scanf ( "%d%d", &a, &b ) != EOF )
    {
  if (a == 0 && b == 0)
  {
   printf("1 ");
   continue;
  }
        if ( a > b )
        {
            c = a;
            a = b;
            b = c;
        }
        k = b - a;
        c = ( int )( ( ( 1.0 + sqrt ( 5.0 ) ) / 2.0 ) * ( double )k );
        if ( c == a )
        {
            printf ( "0 " );
        }
        else
        {
            printf ( "1 " );
        }
    }
    return 0;
}

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值