严格劣策略 strictly dominated strategies
不管别人怎么选,我选ai行动的收益都小于a’i,那么ai相比ai’是严格劣策略。
原理:
基本假设:
1、 所有人都想最大化收益。
2、 所有人都知道第1条。
3、 所有人都知道上一条。。。
例子:
玩家2的R比C是严格劣策略,所以他不可能选R,由此得到:
不断重复,最后剩下:(D, C)
例子:
这里M不是严格劣策略,但是玩家以有另一个选择,0.5U+0.5D的组合。
此时增加一行:
因此M比组合策略是严格劣策略。因此删除M这一行。
此时可以算出无穷的纳什均衡解(因为对玩家二怎么选都无所谓)
定理:
不断重复删除严格劣策略的过程会保留纳什均衡解。
因此可以用这种方法先预处理问题。接着用普通方法求纳什解。有的问题直接用剔除严格劣策略的方法就能得到纳什解(dominance solvable game)
剔除的顺序不重要。可以任意顺序
弱劣策略
如果使用弱劣策略来移除,可能会出现一些问题:
1、 顺序不同得到的结果可能不同
2、 可能会删除一些纳什均衡,但是至少会保留一个。
举例:
1\2 | L | R |
---|---|---|
U | 1,1 | 2,1 |
D | 1,2 | 3,1 |
如果先删除R,剩下的是(D,L)。 如果先删除U,剩下的是(D,R)。事实上两个都是纳什均衡。
Maxmin strategies 极大极小策略
达到纳什均衡需要保证所有人理性,且知道对方理性,且知道对方知道自己理性。。。如果有一方出现错误,可能会使得博弈者蒙受巨大损失,因此玩家可以采取极大极小策略。这种策略可能会得到纳什均衡解,可能不会。
极大极小策略在双人的零和游戏中(就是所有结果都符合双方收益和为0)应用很广,因为这种游戏中对方会尽可能最小化我的收益,以最大化自己的收益。
极大极小策略是指个体i会想要最大化这个式子:
m
a
x
s
i
m
i
n
s
−
i
u
i
(
s
1
,
s
2
)
max_{s_i}min_{s_{-i}}u_i(s_1,s_2)
maxsimins−iui(s1,s2)
即这样的策略,使得:在其他人想最小化我的利益的时候,我想最大化我的利益。或者说,做最坏的打算(别人想害我),我要选什么来最大化我的收益。
在硬币游戏中,如果我使用1/2正+1/2反的策略,那么对方不论使用任何策略,我的收益都是0.而如果我不使用这样策略(比如我多出正面),对方为了最小化我的收益,会全出正面。
correlated Equilibrium
上面的博弈有3个纳什均衡:(B,B), (F,F),(2/3B+1/3F,1/3B+2/3F),第三个均衡不太符合直觉,因为他会导向BF,FB这种不好的结果。
再考虑两个汽车过十字路口,一个从南到北,一个从东到西。两个纯策略纳什均衡是玩家1走2等或者2走1等,但是还有一个混合策略纳什均衡。这个混合纳什均衡也会出现两人同时走,或者同时等的结果。
一个直觉是第一个游戏抛硬币决定是(BB)还是(FF),第二个博弈设置红绿灯。
这就是协同均衡的想法, 设置一个随机分配,双方都会自动遵守,因为对方遵守的话,我遵守会比不遵守得到的回报多。