博弈论-CSDN博客

本文链接：https://blog.csdn.net/TFrui_/article/details/80950361

1.巴什博弈
• 问题模型：只有一堆n个物品，两个人轮流从这堆物品中取物，规定每次⾄至少取一个，最多取m个，最后取光者得胜

• n%(m + 1) == 0时，先手败，否则先手胜。

•巴什博弈的一般情况见HDU-2897

<抽象模型，有些要找规律>

2.威佐夫博弈
• 问题模型：有两堆各若干个物品，两个人轮流从某一堆或同时从两堆中取同样多的物品，规定每次至少取⼀一个，多者不限，最后取光者得胜。

• 求解：
ak =[k（1+√5）/2]，bk= ak + k （k=0，1，2，…,n 方括号表示取整函数)

（ak,bk)是奇异局势，当A面对奇异局势是必输

<熟记公式>

3.尼姆博弈

• 问题模型：有三堆各若干个物品，两个人轮流从某一堆取任意多的物品，规定每次至少取一个，多者不限，最后取光者得胜。

• 若a ^ b ^ c == 0，则(a, b, c)是必败态

4.SG定理

• SG函数需要Sprague-Grundy定理（SG定理）的理论支持。假设这样一个类nim游戏，n堆火柴，每堆有num[ i ]根火柴，可以把这个游戏拆成n个游戏，每个游戏为：有一堆火柴（设为总游戏中的第k堆），每次一个游戏者可以拿至少一个，至多全部，无法拿者输，两个游戏者轮流取。恩恩，建了这样一个问题模型，SG定理：游戏和的SG函数等于各个子游戏SG函数的Nim和。这样，可以用分治的思想简化问题。（所以，Nim中的Bouton定理（即所有数nim和？= 0 的判定定理）可以看做SG定理在Nim游戏中的直接应用，因为单堆Nim游戏SG函数为SG（x） = x ），SG函数值是它的所有子游戏的SG函数值的异或。（0必败）

SG函数的难点就在于找必败（必胜状态）然后和单堆nim思路建立联系，或者直接模拟sg函数过程。

主要有两种模拟SG函数的过程：（总结自hdu 1848）

1：普通直接模拟

#define MAXN 1000

int sg[MAXN + 5];

//num[ 1 , 2 ....] :可以取走的石子个数

//而used数组用于记录后继状态的sg值存在与否

//count：num数组中有效数字总数

void SG(int x)

{

memset(sg , 0 , sizeof(sg));

for(int i = 1; i <= x; i++)

{

bool used[MAXN + 5] = {0};

for(int j = 1; j <= count; j++)

{

if(i - num[ j ] >= 0)

used[ sg [ i - num[ j ] ] ] = 1;

}

for(int j = 0; j <= i; j++)

{

if(used[j] == 0)

{

sg[i] = j;

break;

}

}
2：用dfs进行优化

int SG_dfs(int x)

{

if(sg[x] != -1)

return sg[x];

bool used[MAXN + 5] = {0};

for(int i = 1; i <= count; i++)

{

if(x >= num[ i ])

{

sg[x - num[i]] = SG_dfs(x - num[i]);

used[ sg [ x - num[ i ] ] ] = 1;

}

for(int i = 0; i <= x; i++)//i <= x可有可无，但为了安全，还是加上

{

if(used[i] == 0)

{

return sg[x] = i;

}

5.PN图的构建

P（previous）：必败状态
N（next）：必胜状态
特点1 ：该状态为必败状态，当且仅当所有后继都是必胜状态。
特点1 ：该状态为必胜状态，当且仅当至少一个后继时必败状态。
特例：没有后继状态（即终态）为必败状态。
所以，可以根据终态为P

例如：HDU-2147

PN图构建代码为：

#include <bits/stdc++.h>
using namespace std;
bool ma[2001][2001];//1 P 0 N;
int main(){
       int i,j,k;
       ma[1][1]=1;
       for(i=2;i<=2000;i++)
       {
              if(ma[i-1][1])
                     ma[i][1]=0;
              else ma[i][1]=1;
              for(j=2;j<i;j++){
                     if(!ma[i][j-1]&&!ma[i-1][j-1]&&!ma[i-1][j])
                            ma[i][j]=1;
                     else ma[i][j]=0;
              }
              if(ma[1][i-1])
                     ma[1][i]=0;
              else ma[1][i]=1;
              for(j=2;j<i;j++){
                     if(!ma[j-1][i]&&!ma[j-1][i-1]&&!ma[j][i-1])
                            ma[j][i]=1;
                     else ma[j][i]=0;
              }
              if(!ma[i][i-1]&&!ma[i-1][i-1]&&!ma[i-1][i])
                     ma[i][i]=1;
              else ma[i][i]=0;
       }
       int M,N;
       for(i=1;i<=10;i++){
              for(j=1;j<=10;j++)
                     printf("%c ",ma[i][j]?'P':'N');
              printf("\n");
       }
       while(scanf("%d%d",&M,&N)&&M&&N){
              if(ma[M][N]) printf("What a pity!\n");
              else printf("Wonderful!\n");
       }
       return 0;
}

<不同题目有不同的构建代码，但都按照PN图两个特点来实现>

<部分题目手动画PN图很方便~>

6.FIB博弈

• 有一堆个数为n的石子，游戏双方轮流取石子，满足：

1.先手不能在第一次把所有的石子取完；

2.之后每次可以取的石子数介于1到对手刚取的石子数的2倍之间（包含1和对手刚取的石子数的2倍）。

约定取走最后一个石子的人为赢家，求必败态。

斐波那契博弈有一个非常重要的性质：

先手必败，当且仅当石子数为斐波那契数：