博弈论学习小记

参考
https://www.cnblogs.com/Wolfycz/p/8430991.html
http://www.cnblogs.com/frog112111/p/3199780.html

引言

取石子游戏:A和B两人轮流取走共n颗的石子,每次可取1,2或3颗。A先取,取走最后一颗石子的人获胜。
思考:A有没有必胜的策略?
分析:当n为0,4,8,12……时,A必定会输,因为不论A取多少,B只要和A共同取走4即可;当n不为0,4,8,12……时,A只需要将n取成4的倍数,这样就变成了B先取,B一定会输,所以A一定会赢。
也就是说,对这个游戏而言,0,4,8,12……这些状态是对于先手的必败状态,而其他状态是对于先手的必胜状态。
以此类推,如果每次不一定取1,2,3颗,而是取1∼m颗,那么就可以得到,如果n%(m+1)=0,即为先手必败状态,否则为先手必胜状态。而这个游戏就是著名的巴什博弈(Bash Game)。博弈的许多题目就是从巴什博奕变换而来的。

一、实例S-Nim及解题分析
题目链接
Input
2 2 5
3
2 5 12
3 2 4 7
4 2 3 7 12
5 1 2 3 4 5
3
2 5 12
3 2 4 7
4 2 3 7 12
0
Sample Output:
LWW
WWL

题目大意:
此题在Nim游戏的基础上加了条件,给出一个集合S={s1,s2,…,sk}k个正整数,A、B每次取石子的数目必须是集合里的数,拿最后一个珠子的人获胜。
k s1 s2 … sk
m
n1 x1 x2 … xn
n2 x1 x2… xn

nm x1 x2… xn
给出一个数k,代表集合S的大小,接下来紧跟着k个数,表示集合S里的数。接下来一行数为m代表有m个游戏,后面m行每行第一个数字为n代表有n堆石子,后面紧跟着n个数x1…xn代表每堆石子的个数。
输出n个字母,第i个字母为“W”代表第i个游戏先手必胜,“L”代表第i个游戏先手必败。
注意:对于状态可能有循环时,需要注意平局的情况,但这个游戏中石子数是始终减少的,所以不存在这种状况。

解题思路:
这道题比巴什博奕看起来要难一些。我们的问题仍然是求知A是否还有必胜策略。第一想法是dp做,但状态数太多,搜索和动态规划都无法完成,就需要考虑别的方法。
需要寻找哪些状态是P状态,哪些是N状态。
算法设计:
引入SG(Sprague-Grundy)函数
f(v)=mex{f(u)∣u为v的后继状态}
它的自变量是任意整数集合,函数值是不属于该集合的最小自然数。
mex(A)=min{k|k∈∁NA}
mex(S)为求出不属于集合S的最小非负整数的运算。
SG(n)对应的值就是《挑竞》中说的Grundy值。
根据当前状态的grundy值是除任意一步所能转移到的状态的Grundy值以外的最小非负整数这个性质来计算Grundy值。
这样的grundy值,和Nim中的一个石子堆类似,有下列性质
1.Nim中有x颗石子的石子堆,能够转移成有0,1,…,x-1颗石子的石子堆
2.从Grundy值为x的状态出发,可以转移到grundy值为0,1,…,x-1的状态。
与Nim不同的是,转移后的Grundy值有可能增加。
对于Nim,需要把所有堆的石子异或一遍,最后得到的值若为0则是必败态,非0则为必胜态。
而对于此题,SG(G)=SG(1) xor SG(2) xor SG(3)…xor SG(m)
某个局面必败,当且仅当该局面对应的SG函数值>0
某个局面必败,当且仅当该局面对应的SG函数值=0(没办法再拿出石子)
简单说,终止状态的SG值显然为0,并且SG值为0的状态就是P状态,SG值不为0的状态就是N状态。
即与处理Nim问题同理。

注意对于sg(x)的理解(想了好久)
下面是一个例子,有助于对sg函数的理解(并不是简单的集合的数+1,而是需要递推关系所得):
有1堆n个的石子,每次只能取{1,3,4}个石子,先取完石子者胜利,那么各个数的SG值为多少?

sg[0]=0,f[]={1,3,4},
x=1时,可以取走1-f{1}个石子,剩余{0}个,mex{sg[0]}={0},故sg[1]=1;
x=2时,可以取走2-f{1}个石子,剩余{1}个,mex{sg[1]}={1},故sg[2]=0;
x=3时,可以取走3-f{1,3}个石子,剩余{2,0}个,mex{sg[2],sg[0]}={0,0},故sg[3]=1;
x=4时,可以取走4-f{1,3,4}个石子,剩余{3,1,0}个,mex{sg[3],sg[1],sg[0]}={1,1,0},故sg[4]=2;
x=5时,可以取走5-f{1,3,4}个石子,剩余{4,2,1}个,mex{sg[4],sg[2],sg[1]}={2,0,1},故sg[5]=3;
以此类推…
x 0 1 2 3 4 5 6 7 8…
sg[x] 0 1 0 1 2 3 2 0 1…

3、关键代码(sg函数的计算)

sg[x] x表示的是石子数
sg[x]表示石子数=x的状态时能取到的不属于集合S的最小非负整数
size是k(集合s的元素个数)

    const int N=1e2,M=1e4;
    int S[N+10],sg[M+10];
    bool vis[N+10];
    int size;
    	void prepare(){
        memset(sg,0,sizeof(sg));//每次游戏都要算一次sg
        for (int i=1;i<=M;i++)//   i代表的是石子数
        {
            memset(vis,0,sizeof(vis));
            for (int j=1;j<=size;j++)
            {                   //      j<=k  (所能取的石子数集合元素个数)
                if (i<S[j]) break;         //如果石子数<所能取的石子数 跳出
                vis[sg[i-S[j]]]=1; 
      //递推表达式否则标记vis[sg[剩下的石子数]=(之前计算的sg[])]=1
            }
            for (int j=0;j<=N;j++)  if (!vis[j]){sg[i]=j;break;} sg[]=最小能取的个数
        }
    }

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
提供的源码资源涵盖了安卓应用、小程序、Python应用和Java应用等多个领域,每个领域都包含了丰富的实例和项目。这些源码都是基于各自平台的最新技术和标准编写,确保了在对应环境下能够无缝运行。同时,源码中配备了详细的注释和文档,帮助用户快速理解代码结构和实现逻辑。 适用人群: 这些源码资源特别适合大学生群体。无论你是计算机相关专业的学生,还是对其他领域编程感兴趣的学生,这些资源都能为你提供宝贵的学习和实践机会。通过学习和运行这些源码,你可以掌握各平台开发的基础知识,提升编程能力和项目实战经验。 使用场景及目标: 在学习阶段,你可以利用这些源码资源进行课程实践、课外项目或毕业设计。通过分析和运行源码,你将深入了解各平台开发的技术细节和最佳实践,逐步培养起自己的项目开发和问题解决能力。此外,在求职或创业过程中,具备跨平台开发能力的大学生将更具竞争力。 其他说明: 为了确保源码资源的可运行性和易用性,特别注意了以下几点:首先,每份源码都提供了详细的运行环境和依赖说明,确保用户能够轻松搭建起开发环境;其次,源码中的注释和文档都非常完善,方便用户快速上手和理解代码;最后,我会定期更新这些源码资源,以适应各平台技术的最新发展和市场需求。
提供的源码资源涵盖了安卓应用、小程序、Python应用和Java应用等多个领域,每个领域都包含了丰富的实例和项目。这些源码都是基于各自平台的最新技术和标准编写,确保了在对应环境下能够无缝运行。同时,源码中配备了详细的注释和文档,帮助用户快速理解代码结构和实现逻辑。 适用人群: 这些源码资源特别适合大学生群体。无论你是计算机相关专业的学生,还是对其他领域编程感兴趣的学生,这些资源都能为你提供宝贵的学习和实践机会。通过学习和运行这些源码,你可以掌握各平台开发的基础知识,提升编程能力和项目实战经验。 使用场景及目标: 在学习阶段,你可以利用这些源码资源进行课程实践、课外项目或毕业设计。通过分析和运行源码,你将深入了解各平台开发的技术细节和最佳实践,逐步培养起自己的项目开发和问题解决能力。此外,在求职或创业过程中,具备跨平台开发能力的大学生将更具竞争力。 其他说明: 为了确保源码资源的可运行性和易用性,特别注意了以下几点:首先,每份源码都提供了详细的运行环境和依赖说明,确保用户能够轻松搭建起开发环境;其次,源码中的注释和文档都非常完善,方便用户快速上手和理解代码;最后,我会定期更新这些源码资源,以适应各平台技术的最新发展和市场需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值