混合策略纳什均衡

混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策,其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值,否则,一个博弈者会选择那个期望值最高的策略而排除所有其他策略,这意味着原初的状态不是一个均衡。

名词说明

纯策略:1和0 绝对的侧率选择。比如选择去公园和不去公园就是纯策略

混合策略:参与者使他的的纯策略的选择随机化,那么就是混合策略。比如选择去公园的概率是0.6,这就是一个混合策略

举例说明:

clip_image002

设警察去街道的概率是p,那么去公园的概率就是1-p

毒贩去街道的概率是d,那么去公园的概率就是1-d

混合侧率的目标:使得每一纯策略具有相同的期望值

在该情况下:

clip_image004

同理,也可以求出毒贩的d=6/13

clip_image006

纯冲突和防范行为博弈

极大极小策略即用来使参与者达到最优状态的策略,即会设想到其他参与者通过选择策略来使参与者支付最小。

举例说明:

clip_image008

用VH(PH,SM)表示福尔摩斯的期望支付,如果他选择混合策略PH(去多尔佛的概率),SM表示莫瑞特的纯策略。

福尔模式的极大极小策略可以解决以下问题:在已知PH的情况下,当SM被选择来使VH(PH,SM)最小化时,用PH来使VH(PH,SM)最大化。

当莫瑞特去多尔佛时,福尔摩斯的期望支付是VH(PH,)=PH*20+(1-PH)*70=70-50PH

同理可以多瑞特去坎特伯雷时,福尔摩斯的期望支付是VH(PH,)=10+80PH

clip_image010

莫瑞特会根据PH使得福尔摩斯的支付最小,福尔摩斯的极大点是PH=6/13。如果一个参与者知道你会做出的选择,那么你做出随机化的选择将更好。对方很难进行一个揣测。

总结

可以看出混合策略是算别的参与者的支付相等,最终使得每一个参与者无论选择哪一种纯策略都有相同的支付。而最大最小策略是使自己无论选择哪一种策略,都可以获得相同的支付,那么其他参与者就无法通过纯侧率来降低自己的支付。

  • 4
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值