混合策略求解

因为看到版上经常有人对此有疑问,特整理一个简单的方法供大家参考。

百度百科上的定义(感觉比较贴切):

在完全信息博弈中,如果在每个给定信息下,只能选择一种特定策略,这个策略为纯策略(pure strategy)。如果在每个给定信息下只以某种概率选择不同策略,称为混合策略(mixed strategy)。混合策略是纯策略在空间上的概率分布,纯策略是混合策略的特例。纯策略的收益可以用效用表示,混合策略的收益只能以预期效用表示。

一般解法(下面我们介绍一种简便的求解混合策略的方法,它不一定严谨,但是管用。 参照网上信息):
以“麦琪的礼物”为例来说明。我们假设丈夫卖表的概率为p,那么不卖表的概率为 1-p,为方便也可将这概率标记在赢利表旁边(如表1);假设妻子剪发的概率为q,那么不剪发的概率为 1-q,为方便把它们记在赢利表下边。 

                                                                                                                               麦琪的礼物

  剪发不剪 
 买表(0,0)(2,1)p
 不买(1,2)(0,0)1-p
  q1-q 



各参与人在各策略下的预期赢利为: 
    丈夫:买表的预期赢利:0×q+2 ×(1-q)=2-2q           (1) 
        不卖的预期赢利:1×q+0 ×(1-q)=q                       (2) 

    妻子:剪发的预期赢利:0×p+2 ×(1-p)=2-2p              (3) 
        不卖的预期赢利:1×p+0 ×(1-p)=p                          (4) 

    注意,丈夫的某个策略的赢利是该策略对应的行中丈夫的赢利与妻子的概率积之和;而妻子的某个策略的赢利是该策略对应的列中妻子的赢利与丈夫的概率积之和。纳什均衡应满足,①妻子选择q使丈夫在各策略之间的预期赢利没有差异,即使式子(1) 
等于式子(2):2-2q=q,可解出q*=2/3;②丈夫选择q使妻子在各策略之间的预期赢利没有差异,即使式子(3)等于式子(4):2-2p=p,可解出p* =2/3。 
    由此,纳什均衡状态下丈夫的混合策略是(2/3,1/3),妻子的混合策略也是(2/3,1/3)。混合纳什均衡为{(2/3,1/3),(2/3,1/3)}。 


另外,如果开始时不是2*2的博弈,求混合策略应先剔除劣势策略 。

转载于:https://www.cnblogs.com/huenchao/p/7743373.html

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值