之前在蓝桥杯官网上看到一个博弈论的视频,感觉懵懵懂懂的,对局面是什么都搞不清,后来慢慢摸索,偶然看了一个博弈论入门视频,所以想总结一下,让有的人能够看到少走弯路。
博弈论:是二人或多人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜目标的理论。博弈论是研究互动决策的理论。博弈可以分析自己与对手的利弊关系,从而确立自己在博弈中的优势,因此有不少博弈理论,可以帮助对弈者分析局势,从而采取相应策略,最终达到取胜的目的。
(一)巴什博奕(Bash Game)
只有一堆n个物品,两个人轮流从这堆物品中取物,规定每次至少取一个,最多取m个。最后取光者得胜。
显然,如果n=m+1,1那么由于一次最多只能取m个,所以,无论先取者拿走多少个,后取者都能够一次拿走剩余的物品,后者取胜。因此我们发现了如何取胜的法则:每个回合时m+1个,如果n=(m+1)*r+s,(r为任意自然数,s≤m),那么先取者要拿走s个物品,如果后取者拿走k(≤m)个,那么先取者再拿走m+1-k个,结果剩下(m+1)(r-1)个,以后保持这样的取法,那么先取者肯定获胜。总之,要保持给对手留下(m+1)的倍数,就能最后获胜。
这个游戏还可以有一种变相的玩法:两个人轮流报数,每次至少报一个,最多报十
个,谁能报到100者胜
【分析】 关键是凑m+1,使剩m+1的倍数给对方 ,那自己必赢
Java实现代码:
package 巴什博弈;
import java.util.Scanner;
public class Main {
/** 思想其实很简单 */
public static void main(String[] args) {
Scanner sc = new Scanner(System.in);
int n = sc.nextInt();// 总共几个石头
int m = sc.nextInt();// 最多能拿几个
int t = sc.nextInt(); // 最少能拿几个
int mod = n % (m + t);
if (mod >= t)
System.out.println("first win");
else
System.out.println("second win");
}
}
8 4 1
first win
还有一个例子:
要种田得有田才行,Lele听说街上正在举行一场别开生面的拍卖会,拍卖的物品正好就是一块20亩的田地。于是,Lele带上他的全部积蓄,冲往拍卖会。
后来发现,整个拍卖会只有Lele和他的死对头Yueyue。
通过打听,Lele知道这场拍卖的规则是这样的:刚开始底价为0,两个人轮流开始加价,不过每次加价的幅度要在1~N之间,当价格大于或等于田地的成本价 M 时,主办方就把这块田地卖给这次叫价的人。
Lele和Yueyue虽然考试不行,但是对拍卖却十分精通,而且他们两个人都十分想得到这块田地。所以他们每次都是选对自己最有利的方式进行加价。
由于Lele字典序比Yueyue靠前,所以每次都是由Lele先开始加价,请问,第一次加价的时候,
Lele要出多少才能保证自己买得到这块地呢?
每组测试包含两个整数M和N(含义见题目描述,0<N,M<1100)
如果Lele在第一次无论如何出价都无法买到这块土地,就输出"none"。
4 2 3 2 3 5
1 none 3 4 5
Java代码:
package 拍卖土地;
import java.util.Scanner;
public class Main {
/**
* @param args
* 两个人拍卖土地 叫价t--M 如果谁刚好叫价到大于等于成本价N就可以得到
* 两个人都懂最优策略 先A叫价 后B叫价 判断谁可以得到土地
* 判断A能不能得到土地 能 最佳的价格是多少 不能 输出none
*/
public static void main(String[] args) {
Scanner sc=new Scanner(System.in);
int t=sc.nextInt();
int M=sc.nextInt();
int N=sc.nextInt();
if(M>N) {
for (int i = N; i < M; i++) {
System.out.print(i+" ");
}
}else{
int mod=N%(M+t);
if(mod<t) System.out.println("none");
else{
System.out.println(mod);
}
}
}
}
(二)Fibonacci’s Game(斐波那契博弈)
有一堆个数为n的石子,游戏双方轮流取石子,满足:
1)先手不能在第一次把所有的石子取完;
2)之后每次可以取的石子数介于1到对手刚取的石子数的2倍之间(包含1和对手刚取的石子数的2倍)。
【分析】:约定取走最后一个石子的人为赢家,求必败态。
这个和之后讲到的Wythoff’s Game 和取石子游戏 有一个很大的不同点,就是游戏规则的动态化。之前的规则中,每次可以取的石子的策略集合是基本固定的,但是这次有规则:一方每次可以取的石子数依赖于对手刚才取的石子数。
这个游戏叫做Fibonacci Nim,肯定和Fibonacci数列:f[n]:1,2,3,5,8,13,21,34,55,89,… 有密切的关系。如果试验一番之后,可以猜测:先手胜当且仅当n不是Fibonacci数。换句话说,必败态构成Fibonacci数列。
就像“Wythoff博弈”需要“Beatty定理”来帮忙一样,这里需要借助“Zeckendorf定理”(齐肯多夫定理):任何正整数可以表示为若干个不连续的Fibonacci数之和。定理的证明可以在这里 看到,不过我觉得更重要的是自己动手分解一下。
比如,我们要分解83,注意到83被夹在55和89之间,于是把83可以写成83=55+28;然后再想办法分解28,28被夹在21和34之间,于是28=21+7;依此类推 7=5+2,故 ;
如果n=83,我们看看这个分解有什么指导意义:假如先手取2颗,那么后手无法取5颗或更多,而5是一个Fibonacci数,如果猜测正确的话,(面临这5颗的先手实际上是整个游戏的后手)那么一定是先手取走这5颗石子中的最后一颗,而这个我们可以通过第二类归纳法来绕过,同样的道理,接下去先手取走接下来的后21颗中的最后一颗,再取走后55颗中的最后一颗,那么先手赢。
反过来如果n是Fibonacci数,比如n=89:记先手一开始所取的石子数为y,若y>=34颗(也就是89的向前两项),那么一定后手赢,因为89-34=55=34+21<2*34,所以只需要考虑先手第一次取得石子数y<34的情况即可,所以现在剩下的石子数x介于55到89之间,它一定不是一个Fibonacci数,于是我们把x分解成Fibonacci数:x=55+f[i]+…+f[j],若,如果f[j]<=2y,那么对B就是面临x局面的先手,所以根据之前的分析,B只要先取f[j]个即可,以后再按之前的分析就可保证必胜。(hdoj 2516)
Java代码理解:
package 斐波拉切数;
import java.util.Scanner;
public class Main {
/**一堆个数为n的石子 游戏双方轮流取石子,满足
* 先手不能在第一次把所有的石子取完;
* 之后每次可取的石子数介于1到对手刚取的石子数的2倍之间
* (包含1和对手刚取的石子数的2倍)
*/
public static void main(String[] args) {
Scanner sc=new Scanner(System.in);
int N=sc.nextInt();//总共n个石子
int[] fib=new int[50];
fib[0]=2;
fib[1]=3;
//斐波那契数列 是前两者之和 那么 如果刚好石子数量等于斐波那契数量 后手赢
for (int i = 2; i < fib.length; i++) {
fib[i]=fib[i-1]+fib[i-2];
}
boolean flag=false;
for (int i = 0; i < fib.length; i++) {
if(fib[i]==N){
flag=true;
System.out.println("second win");
}
if(fib[i]>N) break;
}
if(!flag){
System.out.println("first win");
}
}
}
(三)威佐夫博奕(Wythoff Game)
有两堆各若干个物品,两个人轮流从某一堆或同时从两堆中取同样多的物品,规定每次至少取一个,多者不限,最后取光者得胜。
奇异局势: 这种情况下是颇为复杂的。我们用(ak,bk)(ak ≤ bk ,k=0,1,2,…,n)表示两堆物品的数量并称其为局势,如果甲面对(0,0),那么甲已经输了,这种局势我们称为奇异局势。前几个奇异局势是:(0,0)、(1,2)、(3,5)、(4,7)、(6,10)、(8,13)、(9,15)、(11,18)、(12,20)。
可以看出,a0=b0=0,ak是未在前面出现过的最小自然数,而 bk= ak + k,奇异局势有
如下三条性质:
1.任何自然数都包含在一个且仅有一个奇异局势中。
由于ak是未在前面出现过的最小自然数,所以有ak > ak-1 ,而 bk= ak + k > ak-1 + k-1 = bk-1 > ak-1 。所以性质1。成立。
2.任意操作都可将奇异局势变为非奇异局势。
事实上,若只改变奇异局势(ak,bk)的某一个分量,那么另一个分量不可能在其他奇异局势中,所以必然是非奇异局势。如果使(ak,bk)的两个分量同时减少,则由于其差不变,且不可能是其他奇异局势的差,因此也是非奇异局势。
3.采用适当的方法,可以将非奇异局势变为奇异局势。
从如上性质可知,两个人如果都采用正确操作,那么面对非奇异局势,先拿者必胜;反之,则后拿者取胜。
4.(Betty 定理):如果存在正无理数 A, B 满足 1/A + 1/B = 1,那么集合 P = { [At], t ∈ Z+}、Q = { [Bt], t ∈ Z+} 恰为集合 Z+ 的一个划分,即:P ∪ Q = Z+,P ∩ Q = ø。
5.上述矩阵中每一行第一列的数为 [Φi],第二列的数为 [(Φ + 1)i],其中 Φ = (sqrt(5) + 1) / 2 为黄金分割比。
那么任给一个局势(a,b),怎样判断它是不是奇异局势呢?我们有如下公式:
ak =[k(1+√5)/2],bk= ak + k (k=0,1,2,…,n 方括号表示取整函数)
奇妙的是其中出现了黄金分割数(1+√5)/2 = 1.618…,因此,由ak,bk组成的矩形近似为黄金矩形,由于2/(1+√5)=(√5-1)/2,可以先求出j=[a(√5-1)/2],若a=[(1+√5)/2],那么a = aj,bj = aj + j,若不等于,那么a = aj+1,bj+1 = aj+1+ j + 1,若都不是,那么就不是奇异局势。然后再按照上述法则进行,一定会遇到奇异局势。(poj 1067)
package 威佐夫博弈;
import java.util.Scanner;
public class Main {
/**输入一个局势 判断是否为奇异局势 如果是奇异局势,那么先拿者必胜,后拿着必输
*k=bk-ak;
*/
public static void main(String[] args) {
Scanner sc=new Scanner(System.in);
int a=sc.nextInt();
int b=sc.nextInt();
if(a>b) {
int temp=a;
a=b;
b=temp;
}
int c=(int) ((b-a)*((Math.sqrt(5)+1)/2));
if(a==c) System.out.println("second win");
else System.out.println("first win");
}
}
(四)尼姆博奕(Nimm Game)
有三堆各若干个物品,两个人轮流从某一堆取任意多的物品,规定每次至少取一个,多者不限,最后取光者得胜。
这种情况最有意思,它与二进制有密切关系,我们用(a,b,c)表示某种局势,首先(0,0,0)显然是奇异局势,无论谁面对奇异局势,都必然失败。第二种奇异局势是(0,n,n),只要与对手拿走一样多的物品,最后都将导致(0,0,0)。仔细分析一下,(1,2,3)也是奇异局势,无论对手如何拿,接下来都可以变为(0,n,n)的情形。
计算机算法里面有一种叫做按位模2加,也叫做异或的运算,我们用符号⊕(或者是xor,这个符号不好打,以下用(+)表示)表示这种运算。这种运算和一般加法不同的一点是1+1=0。先看(1,2,3)的按位模2加的结果:
1 =二进制01
2 =二进制10
3 =二进制11 (+)
———————
0 =二进制00 (注意不进位)
对于奇异局势(0,n,n)也一样,结果也是0。
任何奇异局势(a,b,c)都有a(+)b(+)c =0。
如果我们面对的是一个非奇异局势(a,b,c),要如何变为奇异局势呢?假设 a < b< c,我们只要将 c 变为 a(+)b,即可,因为有如下的运算结果: a(+)b(+)(a(+)b)=(a(+)a)(+)(b(+)b)=0(+)0=0。要将c 变为a(+)b,只要从 c中减去 c-(a(+)b)即可。
例1。(14,21,39),14(+)21=27,39-27=12,所以从39中拿走12个物体即可达到奇异局势(14,21,27)。
例2。(55,81,121),55(+)81=102,121-102=19,所以从121中拿走19个物品
就形成了奇异局势(55,81,102)。
例3。(29,45,58),29(+)45=48,58-48=10,从58中拿走10个,变为(29,4
5,48)。(hdoj 1850)
package 尼姆游戏;
import java.util.Scanner;
public class Main {
/**有三堆各若干个物品,两个人轮流从某一堆取任意多的物品,规定每次至少取一个,多者不限,最后取光者得胜。
*
*/
public static void main(String[] args) {
Scanner sc=new Scanner(System.in);
int M=Integer.parseInt(sc.nextLine());
int[] a=new int[M];
int num=0;
int ans=0;
for (int i = 0; i < M; i++) {
a[i]=sc.nextInt();
ans^=a[i];//用ans异或每个a[i] 因为0异或任何数都等于那个数本身
}
if(ans==0){//已经面对奇异局势
System.out.println("second win");
}else{
for (int i = 0; i < M; i++) {
int k=ans^a[i];
if(k<a[i]) {
num++;
//System.out.println(a[i]-k);
}
//(29,45,58),29(+)45=48,58-48=10,从58中拿走10个,变为(29,45,48)。(hdoj 1850)
//(14,21,39),14(+)21=27,39-27=12,所以从39中拿走12个物体即可达到奇异局势(14,21,27)。
//(55,81,121),55(+)81=102,121-102=19,所以从121中拿走19个物品 ,就形成了奇异局势(55,81,102)。
}
}
System.out.println(num);
}
}
多看例子多思考。