2021-07-18

严格劣策略 strictly dominated strategies

在这里插入图片描述
不管别人怎么选,我选ai行动的收益都小于a’i,那么ai相比ai’是严格劣策略。

原理:
基本假设:
1、 所有人都想最大化收益。
2、 所有人都知道第1条。
3、 所有人都知道上一条。。。

例子:

在这里插入图片描述
玩家2的R比C是严格劣策略,所以他不可能选R,由此得到:
在这里插入图片描述
不断重复,最后剩下:(D, C)

例子:

在这里插入图片描述
这里M不是严格劣策略,但是玩家以有另一个选择,0.5U+0.5D的组合。
此时增加一行:
在这里插入图片描述
因此M比组合策略是严格劣策略。因此删除M这一行。
在这里插入图片描述
此时可以算出无穷的纳什均衡解(因为对玩家二怎么选都无所谓)

定理:

不断重复删除严格劣策略的过程会保留纳什均衡解。
因此可以用这种方法先预处理问题。接着用普通方法求纳什解。有的问题直接用剔除严格劣策略的方法就能得到纳什解(dominance solvable game)

剔除的顺序不重要。可以任意顺序

弱劣策略

在这里插入图片描述
如果使用弱劣策略来移除,可能会出现一些问题:
1、 顺序不同得到的结果可能不同
2、 可能会删除一些纳什均衡,但是至少会保留一个。

举例:

1\2LR
U1,12,1
D1,23,1

如果先删除R,剩下的是(D,L)。 如果先删除U,剩下的是(D,R)。事实上两个都是纳什均衡。

Maxmin strategies 极大极小策略

达到纳什均衡需要保证所有人理性,且知道对方理性,且知道对方知道自己理性。。。如果有一方出现错误,可能会使得博弈者蒙受巨大损失,因此玩家可以采取极大极小策略。这种策略可能会得到纳什均衡解,可能不会。

极大极小策略在双人的零和游戏中(就是所有结果都符合双方收益和为0)应用很广,因为这种游戏中对方会尽可能最小化我的收益,以最大化自己的收益。

极大极小策略是指个体i会想要最大化这个式子:
m a x s i m i n s − i u i ( s 1 , s 2 ) max_{s_i}min_{s_{-i}}u_i(s_1,s_2) maxsiminsiui(s1,s2)
即这样的策略,使得:在其他人想最小化我的利益的时候,我想最大化我的利益。或者说,做最坏的打算(别人想害我),我要选什么来最大化我的收益。

在硬币游戏中,如果我使用1/2正+1/2反的策略,那么对方不论使用任何策略,我的收益都是0.而如果我不使用这样策略(比如我多出正面),对方为了最小化我的收益,会全出正面。

correlated Equilibrium

在这里插入图片描述
上面的博弈有3个纳什均衡:(B,B), (F,F),(2/3B+1/3F,1/3B+2/3F),第三个均衡不太符合直觉,因为他会导向BF,FB这种不好的结果。

再考虑两个汽车过十字路口,一个从南到北,一个从东到西。两个纯策略纳什均衡是玩家1走2等或者2走1等,但是还有一个混合策略纳什均衡。这个混合纳什均衡也会出现两人同时走,或者同时等的结果。

一个直觉是第一个游戏抛硬币决定是(BB)还是(FF),第二个博弈设置红绿灯。

这就是协同均衡的想法, 设置一个随机分配,双方都会自动遵守,因为对方遵守的话,我遵守会比不遵守得到的回报多。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值