【知识笔记】博弈论之 关联性均衡

考虑胆小鬼博弈的收益矩阵:
在这里插入图片描述
当双方选择胆小(C)时总体收益达到最大。
对于纳什均衡可以求出(设智能体1选择C的概率为p):
在这里插入图片描述
在这里插入图片描述
当两个智能体选择“ C”的概率均为 0.75,并且选择"D" 的概率为 0.25 时,两个智能体达到了混合策略纳什均衡,其中每个智能体获得的期望效益价值为 4.5。
在这里插入图片描述
两个智能体总效益之和为 9,小于所有两个智能体总效益之和的最大可能值 10。
关联性均衡的目的就是通过设定某种规则,使得最后双方的策略接近于A点的策略。

当两个智能体相关联并且设定每种情况的可能性为 v = [1/3, 1/3, 1/3, 0]时,两个智能体的总效用价值为 9.3333,比纳什均衡的结果要高。
在这里插入图片描述
此时对应的均衡点就移动到了F点。更接近理论最优。

具体实现计算如下:
假设当智能体 1 宣布将选择“ C”时,为了满足每种情况的可能性保持为 v,其对手智能体 2 需要采取混合策略,其选择“ C”和“ D”的可能性分别均为 0.5。
那么当智能体 1 真实选择“ C”的时候,能获得的效益价值为 0.5 × 5 + 0.5 × 3 = 4。
但如果智能体 1 私自改变了决策动作“ D”,在智能体 2 策略不发生改变的情况下,智能体 1 能够收到的效益价值为 0.5 × 6 + 0.5 × 0 = 3,低于选择“ C”情况下的效益价值 4。

因此,在假设两个智能体服从相关联分布的前提下,每个智能体不能改变当前相关联的策略而获得更高的效用价值。

最后给出数学形式的描述:
在这里插入图片描述
一般来说,在图中 ABC 区域中,只要满足上式所示的关系,
其结果均可达到关联性均衡。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

邵政道

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值