2022CCPC桂林站L题Largest Unique Wins纳什均衡

题意规则背景:有n个人,和m,每个人可以选择一个[1,m]的数字,在每个人都选完之后,若存在一个数,这个数字只有一个玩家选择,并且是最大的,那么选择这个数字的玩家胜出得到1分,其余玩家得到-1分,若没有胜出的玩家,每个人得到0分

题意:给出n和m,每个人可以对每个[1,m]的数分配概率,并且保证每个数分配的概率和为1.00,此后,他们会按照概率随机选择一个数,问能否构造出一个博弈局面,使得这个局面是一个纳什均衡。

首先,我们要先知道什么是纳什均衡,词条是这么解释的:纳什均衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果任意一位参与者在其他所有参与者的策略确定的情况下,其选择的策略是最优的,那么这个组合就被定义为纳什均衡。

我们可以通俗一点理解,那么就是假若你是多名玩家中的一名,如果你知道了其他人的博弈策略,你可以改变自己当前的策略,但是不存在一个新的策略,使得新策略的受益会大于你的当前策略。

对于题目,我们可以看看当只有两个人的时候,m等于3是怎么样一个情况

首先,假若你是第一号玩家,你肯定选择数字3,那么对于第二号玩家而言,如果选择数字3,那么双方的受益为0,但是如果选择其他数字,一号玩家会成为赢家,那么二号玩家的受益就会变成-1。所以,双方最优的策略是所有的概率都投给3(也就是选3号数字)

数字3数字2数字1收益
玩家11.000.000.000
玩家21.000.000.000

接下来,考虑一个特殊情况n=m*2,我们可以让每个玩家只投一个数字并且依次是m,m,m-1,m-1,m-2,m-2,....1,1。

数字3数字2数字1收益
玩家11000
玩家21000
玩家30100
玩家40100
玩家50010
玩家60010

对于n=m*2的情况,我们先考虑第一个玩家,他可以选择数字最大的3,第二名玩家也选择3,此后玩家3和4都选数字2,以此类推。这样的情况下,每个人的收益都是0,对于任意一方来说,都没有更优的策略,假若玩家1选择别的数字,那么玩家2就会成为赢家,那么玩家1的收益就会从0变为-1。

如果n>m*2,在此局面之前,我们可以知道n=m*2,可以使得每个人的收益都为0,那么只需要前n个人按照前面的方法去投数字,剩下的人,随意投,收益都为0,此时满足纳什均衡状态。

其实,对于剩下的情况,结果也是一样的构造方法。

举例n=5,m=4的时候

数字4数字3数字2数字1收益
玩家11000-1
玩家21000-1
玩家30100-1
玩家40100-1
玩家500101

对于当前的局面,可能会感觉很疑惑或者不合理,因为可能觉得这样是不是对于除了5号的别的玩家不公平,为什么玩家1号不选择投数字2呢?但是其实,当前玩家1如果选择投数字2,那么玩家2就成了赢家,而玩家1的收益依旧是-1,没有变化,也就是说,玩家1目前的决策已经是最优的了,没必要再变化。对于剩下的玩家而言也是一样的,这时候,这就是一个纳什均衡的状态。

当然并不是说只能存在这一种,其实可以有很多种,只不过这种也是满足的

所以这题的构造就是对于n个玩家,依次选择m,m,m-1,m-1,m-2...以此类推

(本人对于纳什均衡的理解并不多,如果有错误的地方,欢迎指出,谢谢~)

  • 5
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值