1.1 博弈论(sg函数)

本文介绍了博弈论的基础知识,包括巴什博弈、威佐夫博弈和Nim博弈,重点讲解了sg函数的概念及其求解策略。通过实例题目如HOJ1847、HOJ3980等,深入探讨了sg函数在解决博弈问题中的应用。
摘要由CSDN通过智能技术生成

博弈论

出自于省赛的丢人,算是第一篇博客吧,来学习博弈论


巴什博弈

  • 只有一堆n个物品,两个人轮流从这堆物品中取物,规定每次至少取一个,最多取m个。
    最后取光者得胜。

显然,如果n=m+1,那么由于一次最多只能取m个,所以,无论先取者拿走多少个,

后取者都能够一次拿走剩余的物品,后者取胜。因此我们发现了如何取胜的法则:

如果n=(m+1)r+s,(r为任意自然数,s≤m),那么先取者要拿走s个物品,如果后取者拿走
k(≤m)个,那么先取者再拿走m+1-k个,结果剩下(m+1)(r-1)个,以后保持这样的
取法,那么先取者肯定获胜。总之,要保持给对手留下(m+1)的倍数,就能最后获胜。


威佐夫博弈

  • 有两堆各若干个物品,两个人轮流从某一堆或同时从两堆中取同样多的物品,规定每次至少取一个,多者不限,最后取光者得胜。

我们再用逆推归纳法分析。我们用(ak,bk)(ak
≤ bk ,k=0,1,2,…,n)表示两堆物品的数量并称其为局势,如果甲面对(0,0),那么甲已经输

了,这种局势我们称为奇异局势。

前几个奇异局势是:(0,0)、(1,2)、(3,5)、(4,7)、(6,10)、(8,13)、(9,15)、(11,18)、(12,20)。

可以看出,a0=b0=0,ak是未在前面出现过的最小自然数,而 bk= ak + k。

若两堆物品的初始值为(a , b),且x < y,定义k=b-a;定义x = [ ( ( sqrt(5) + 1 ) / 2 ) * k ]
若x=a,则先手必败,否则先手必胜。


Nim博弈

  • 有n堆各若干个物品,两个人轮流从某一堆取任意多的物品,规定每次至少取一个,多者不限,最后取光者得胜。

这里奇异局势变成了多堆(x1,x2,x3…..),所以有一个结论就是把每堆Xi异或起来,结果为0则先手必败


sg函数

在网上看过了很多介绍sg函数的文章,但是感觉还是不太明白,就像当初第一次知道dp的时候。。。。。所以,还是自己再进行以下,浅显的个人理解。
sg函数:SG(x)=mex{ SG(y) | x->y },mex(x)表示非x集合中最小的自然数
以下就是个人的浅显理解:
在解释之前,首先要知道sg值只需要关注0非0两种状态就行了

在看了mex函数之后,是不是感觉字面理解了,但是,啥意思呢?
首先,一个点的下一个状态,也就是子状态会有很多个,然后每个子状态又会有自己的子状态。当一个状态的子状态可以直接判断为必胜态或者必败态的时候,子状态返回自己的sg值,然后,用一个vis数组存下来,这里vis数组就相当于mex函数,然后当当前状态所有子状态都返回了自己的sg值,并用vis记录了下来,那么,vis从0开始,没有被标记过的第一个自然数则是当前状态的sg值。
当一个值被vis数组记录过,那么说明当前状态可以转换成对应sg值的状态,那么,如果0被标记了,那么说明当前状态可以转换成必败态,呢么当前状态的sg值一定是非0的,也就是必胜态。到这里,mex函数的意义是不是有点明白了,就是寻找第一个不能转换到的状态,那么,在看之前说的只需要关注0非0两种状态就行了,意思就是,当你通过mex函数也就是vis数组找到的当前点的sg值为0则说明,当前点没办法转换到必败态,那么,当前点就是必败态,所以sg值为0;反之,非0则说明可以转换到必败态,那么当前则是必胜态。

当所有点的sg值都推出来了,答案一般就是所求点的sg值异或,异或值为0则先手必败,否则先手必胜。

那么,之前求出来的sg值非0时会有相同的值,那想一下,一旦出现了两个相同的先手必胜态,先手走什么,后手模仿的话,那么肯定是先手输,所以sg值非0相同时,异或值也是0,这个应该比较好想。

以上就是个人的理解,如有错误,希望大家帮我指出,不胜感激。

以下就是一些入门级的博弈论题目,有很多种解法,为了练习sg函数,就用的是sg函数的解法。希望大家能从中受益。

题目+代码

HOJ1847(单堆取次幂)

sg入门 :

#include<bits/stdc++.h>
using namespace std;

int main() {
    int n = 0;
    int cnt[10];
    int sg[1005];
    int s[1005];
    memset(cnt,0,sizeof(cnt));
    for(int i = 
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值