博弈汇总

收录几篇比较棒的文章作参考.

文章1

文章2

文章3

题集1

题集2

简单总结:

①巴什博奕

只有一堆n个物品,两个人轮流从这堆物品中取物,规定每次至少取一个,最多取m个。最后取光者得胜。
 

显然,如果n=m+1,那么由于一次最多只能取m个,所以,无论先取者拿走多少个,后取者都能够一次拿走剩余的物品,后者取胜。因此我们发现了如何取胜的法则:如果n=(m+1)r+s,(r为任意自然数,s≤m),那么先取者要拿走s个物品,如果后取者拿走k(≤m)个,那么先取者再拿走m+1-k个,结果剩下(m+1)(r-1)个,以后保持这样的取法,那么先取者肯定获胜。总之,要保持给对手留下(m+1)的倍数,就能最后获胜。那么这个时候只要n%(m+1)!=0,先取者一定获胜。

 

int main()
{
	int t,n,m;
	cin>>t;
	while(t--)
	{
		scanf("%d %d",&n,&m);
		if(n<= m)
		{
			printf("先手赢\n");
			continue;
		}
		if(n%(m+1) == 0)
		{
			printf("后手赢\n");
			continue;
		}
		printf("先手赢\n");
	}
	return 0;
}


②尼姆博奕

 

若干堆各若干个物品,两个人轮流从某一堆取任意多的物品,规定每次至少取一个,多者不限,最后取光者得(负)。

具体证明请看链接,下面主要写几个扩展类型。

裸的板子就是:

 

#include<cstdio>
#include<iostream>
#include<algorithm>
using namespace std;
//假设先拿完的输
int n,ans; 
int a[maxn];

int main()
{
	int t;
	cin>>t;
	while(t--)
	{
		scanf("%d",&n);
		ans = 0;
		int cnt = 0;
		for(int i = 1;i<= n;i++)
			cin>>a[i];
		
		sort(a+1,a+n+1);
		if(a[1] == a[n]&&a[1] == 1)
		{
			if(n%2 == 1)
				cout<<"后手"<<endl;
			else
				cout<<"先手"<<endl;
			continue;
		}
		for(int i = 1;i<= n;i++)
			ans^= a[i];
		if(ans == 0)
			cout<<"后手"<<endl;
		else
			cout<<"先手"<<endl;
	}
	return 0;
}


扩展①:

 

有N堆石子,其中第i堆有Pi颗石子,每次去掉某一堆里最多m棵石子(m>0),两人轮流取石,拿最后一个的人就输了。什么情况下先手必胜,什么情况下后手必胜?

思路:将P1,P2,P3, … Pn 对m+1求余得到q1,q2,q3, …,qn然后符合定理一的结果,记H=q1^q2^q3^ …^qn 。若H=0则为先手数局面,否则为后手输局面。

 

扩展②:

有N堆石子,其中第i堆有Pi颗石子,每次可以从最多K堆中选出若干石子去掉(但不能不去石子),两人轮流取石,谁取最后一个就输了。

思路:K=1,为Nim问题。
对于K>1的情况,我们令把P1~Pn这n个数,转成二进制,然后每位分别相加,每位最后结果mod (K+1)即可。如果每一位结果都是0,则为先手输局面,否则是后手输局面。

 

扩展③:

SG函数,一个非常有意思的定理,当拿物品的规则不同的时候就可以用它来解决。(整体值等于局部值的亦或)

首先定义mex(minimal excludant)运算,这是施加于一个集合的运算,表示最小的不属于这个集合的非负整数。例如mex{0,1,2,4}=3、mex{2,3,5}=0、mex{}=0。
 对于任意状态 x , 定义 SG(x) = mex(S),其中 S 是 x 后继状态的SG函数值的集合。如 x 有三个后继状态分别为 SG(a),SG(b),SG(c),那么SG(x) = mex{SG(a),SG(b),SG(c)}。 这样 集合S 的终态必然是空集,所以SG函数的终态为 SG(x) = 0,当且仅当 x 为必败点P时。

 

假设有1堆n个的石子,每次只能取{ 1, 3, 4 }个石子,先取完石子者胜利,那么各个数的SG值为多少?


SG[0]=0,f[]={1,3,4},

x=1 时,可以取走1 - f{1}个石子,剩余{0}个,所以 SG[1] = mex{ SG[0] }= mex{0} = 1;

x=2 时,可以取走2 - f{1}个石子,剩余{1}个,所以 SG[2] = mex{ SG[1] }= mex{1} = 0;

x=3 时,可以取走3 - f{1,3}个石子,剩余{2,0}个,所以 SG[3] = mex{SG[2],SG[0]} = mex{0,0} =1;

x=4 时,可以取走4-  f{1,3,4}个石子,剩余{3,1,0}个,所以 SG[4] = mex{SG[3],SG[1],SG[0]} = mex{1,1,0} = 2;

x=5 时,可以取走5 - f{1,3,4}个石子,剩余{4,2,1}个,所以SG[5] = mex{SG[4],SG[2],SG[1]} =mex{2,0,1} = 3;

以此类推.....

   x        0  1  2  3  4  5  6  7  8....

SG[x]    0  1  0  1  2  3  2  0  1....

由上述实例我们就可以得到SG函数值求解步骤,那么计算1~n的SG函数值步骤如下:

1、使用 数组f 将 可改变当前状态 的方式记录下来。

2、然后我们使用 另一个数组 将当前状态x 的后继状态标记。

3、最后模拟mex运算,也就是我们在标记值中 搜索 未被标记值 的最小值,将其赋值给SG(x)。

4、我们不断的重复 2 - 3 的步骤,就完成了 计算1~n 的函数值。

 

解题模型:

   1.把原游戏分解成多个独立的子游戏,则原游戏的SG函数值是它的所有子游戏的SG函数值的异或。

      即sg(G)=sg(G1)^sg(G2)^...^sg(Gn)。//考虑尼姆博奕,每一堆的sg值为那一堆数量本身,可以一个一个找规律发现

   2.分别考虑每一个子游戏,计算其SG值。

     SG值的计算方法:(重点)

1.可选步数为1~m的连续整数,直接取模即可,SG(x) = x % (m+1);//考虑巴什博奕

2.可选步数为任意步,SG(x) = x;//当然一次性拿完,所以sg值为它本身

3.可选步数为一系列不连续的数,用模板计算。

 

SG函数模板

 

//f[]:可以取走的石子个数
//sg[]:0~n的SG函数值
//hash[]:mex{}
int f[N],sg[N],hash[N];     
void getSG(int n)
{
    int i,j;
    memset(sg,0,sizeof(sg));
    for(i=1;i<=n;i++)
    {
        memset(hash,0,sizeof(hash));
        for(j=1;f[j]<=i;j++)
            hash[sg[i-f[j]]]=1;
        for(j=0;j<=n;j++)    //求mes{}中未出现的最小的非负整数
        {
            if(hash[j]==0)
            {
                sg[i]=j;
                break;
            }
        }
    }
}

 

 

 

 

 

③威佐夫博弈

有两堆各若干个物品,两个人轮流从某一堆或同时从两堆中取同样多的物品,规定每次至少取一个,多者不限,最后取光者得胜。

奇异局势公式:
a[k]=[k*(1+√5)/2],b[k]=a[k]+k。(k=0,1,2......,[ ]表示取整)

有趣的是,式中的(1+√5)/2正是黄金分割比例。

模板代码:

 

//威佐夫博弈模板  
#include <stdio.h>  
#include <math.h>  
const double Gsr=(1+sqrt(5.0))/2;  
void swap(int &a,int &b)  
{  
    int t=b;  b=a;  a=t;  
}  
int main()  
{  
    int a,b;  
    while(~scanf("%d%d",&a,&b))  
    {  
        if(a>b)  
            swap(a,b);  
        if(a == (int)(Gsr*(b-a))) //奇异局势,先拿者输  
            puts("First Lose");  
        else  
            puts("First Win");  
    }  
    return 0;  
} 

 

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值