第十一章:纳什均衡的计算

  • A\∅ 表示集合A除去空集所得到的集合

1. 静态,完全信息下的纳什均衡求解

在这里插入图片描述

第一步【严格劣策略删除】
  • 解析:即无论其他玩家 怎么选择策略,玩家 i i i 选择的该策略后获得的利益,都比选择其他策略要低。那么这个策略就是严格劣策略的,显然,玩家 i i i 不会选

  • 假设玩家 1 选择策略 B ,那么,显然,无论玩家 2 选择任何策略,玩家 1 选择 T 策略都比 B 策略要好,(2>1)(1>0)(4>3)。

  • 这时,对于玩家 1 而言,B 就是 T 的一个严格劣策略,将其删除 在这里插入图片描述

  • 同理,对于玩家 2 而言,C 是 R 的一个严格劣策略 (1,1)<(4,2) (1,2)<(2,3)。继续删除
    在这里插入图片描述

第二步:画线法
  • 思想:当其他参与者选择策略之后,如何让自己的利益获得做大化

    • 解:当玩家 2 选择策略时 L,玩家 1 为了使得自己的利益最大化,一定会选择 策略 M。这时,我们在 3 下面话一条横线,
    • 当玩家 2 选择策略时 R,玩家 1为了使得自己的利益最大化,一定会选择 策略 T。这时,我们在 4 下面话一条横线
      在这里插入图片描述
    • 同理,当玩家 1 选择 T 时,玩家 2 选 R
    • 当玩家 1 选择 M 时,玩家 2 选 L
      在这里插入图片描述
  • 当一个策略下方数值都会画上横线时,那么这个策略就达到了纳什均衡。

  • 注意:
    在这里插入图片描述
    在这里插入图片描述

上面的博弈中,针对但单点集支撑,她没有纳什均衡的集合。

2. 混合策略组的支撑与纳什均衡的计算

在这里插入图片描述在这里插入图片描述在这里插入图片描述

在这里插入图片描述

支撑的分析与计算:
  • { A , B } × { B } \{A,B\}\times\{B\} {A,B}×{B} { A , B } × { A } \{A,B\}\times\{A\} {A,B}×{A} 表示 参与者 1 的正概率的纯策略组 × \times × 第二个人分别选择B,A时的支撑
    在这里插入图片描述
  • 如上图所示,我们可以计算玩家 1 玩家 2 的混合策略的支撑
    • 玩家 1 : { T } , { B } , { T , B } \{T\},\{B\},\{T,B\} {T},{B},{T,B} 三种支撑

    • 玩家 2: { L } , { M } , { R } , { L , M } , { L , R } , { M , R } , { L , M , R } \{L\},\{M\},\{R\},\{L,M\},\{L,R\},\{M,R\},\{L,M,R\} {L},{M},{R},{L,M},{L,R},{M,R},{L,M,R} 七种支撑

    • 混合策略组支撑个数为: 3 × 7 = 21 3\times7=21 3×7=21 种,上面的支撑有漏掉的,试着找找看吧?哈哈哈!!!
      在这里插入图片描述
      在这里插入图片描述

    • 根据画线法排除单点集支撑,然后,剩下的就一个一个慢慢算喽,

    • 注意上式 U 2 ( 1 / 2 , 1 / 2 ; R ) > U 2 ( 1 / 2 , 1 / 2 , L ) U_2(1/2,1/2;R)>U_2(1/2,1/2,L) U2(1/2,1/2;R)>U2(1/2,1/2,L),支撑外面【 { T , B } × { L , M } 里 面 没 有 R \{T,B\}\times\{L,M\}里面没有R {T,B}×{L,M}R】的要比支撑里面的好,所以,这不是一个纳什均衡。在计算 { T , B } { L , M , R } \{T,B\}\{L,M,R\} {T,B}{L,M,R} 时, p ∗ p^* p 出现两个结果,所以这个也不是。

σ 1 ∗ 与 σ 2 ∗ 的 计 算 分 析 \sigma_1^* 与\sigma_2^* 的计算分析 σ1σ2
  • 为什么 3 σ 2 ∗ ( A ) = σ 2 ∗ ( B ) 3\sigma_2^*(A)=\sigma_2^*(B) 3σ2(A)=σ2(B) σ 1 ∗ ( A ) = 3 σ 1 ∗ ( B ) \sigma_1^*(A)=3\sigma_1^*(B) σ1(A)=3σ1(B)

  • 假设 2 号玩家选择 A 方案的概率为 p p p 那么选择 B 方案的概率就为 1 − p 1-p 1p,根据 u 1 ( A , σ 2 ∗ ) = u 1 ( B , σ 2 ∗ ) u_1(A,\sigma_2^*)=u_1(B,\sigma_2^*) u1(A,σ2)=u1(B,σ2),我们就会有:

  • 3 p + 0 ( 1 − p ) = 0 p + 1 ( 1 − p ) 3p+0(1-p)=0p+1(1-p) 3p+0(1p)=0p+1(1p)

  • 解得到 p = 1 / 4 ; p=1/4; p=1/4 1 − p = 3 / 4 1-p=3/4 1p=3/4

  • $前面的系数3,0,0,1均为玩家 1 在当前策略下获得利益,应用 3 σ 2 ∗ ( A ) = σ 2 ∗ ( B ) 3\sigma_2^*(A)=\sigma_2^*(B) 3σ2(A)=σ2(B) 等式时,我们没有对概率进行拆分,所以,这是我们要在后面加上(A)(B),即为,玩家 1 选择 A 方案时,玩家 1 选择 B 方案时

  • 12
    点赞
  • 72
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值