如何计算近似纳什均衡_博弈 | 精炼贝叶斯纳什均衡

本文深入介绍了博弈论中的精炼贝叶斯纳什均衡,通过实例解释了如何在不完全信息动态博弈中,参与者根据对方行为更新策略和信念,以达到期望收益最大化。从贝叶斯公式到纳什均衡,再到精炼贝叶斯纳什均衡的概念,帮助读者理解博弈中的动态决策过程。
摘要由CSDN通过智能技术生成

4949aae85307361c70e206efbf24fd95.png

精炼贝叶斯纳什均衡是博弈论中的一个重要概念。为使逻辑表述方便,我们取二人博弈来讲解。在一般情况下,博弈的双方都有一套属于自己的策略集,像是剪刀石头布一样,博弈双方作为局中人,是不知道在接下来的猜拳中,对方会出哪种手势,但如果知道对方出各种手势的概率,那么自己可以针对对方出各种手势的概率来定出自出哪种手势赢的概率大,如果可以量化的话,可以认为这是使自己的期望收益最大化。

下图是本文框架:

214aee04b631803c45aaabffe355c3bc.png

在讲解贝叶斯纳什均衡之前,我们先来看贝叶斯公式和纳什均衡分别是啥。

【贝叶斯公式】

d77ddee55fce979ae1b62f30560d3473.png

在概率论中,条件概率P(A|B)表示在事件B发生的情况下事件A发生的概率,而先验概率P(A)和P(B)表示事件A、B本身发生的概率。

为了方便理解,我们回想下我们日常生活中是如何判别一个人是好人还是坏人的。

faa07aec78fb652e38de6692d507945e.png

在纯理性的情况下,我们先认定,坏人做好事、好人做好事的概率各为0.5。那么现在提出一个问题:如果我们看到街上有一个人做了好事,他是好人的概率是多少?

如果按照目前的判断,这个概率应该是50%。

但是,日常生活经验告诉我们,好人自然是一定会做好事的,那么我们就有了一个条件概率:

351d6b95553772d13efa9fc0f953fc01.png

下标B和A对应着公式中的概率P(B|A)

此时我们依然认为坏人做好事的概率为0.5

现在再设定,我们在大街上遇到好人的概率和遇到坏人的概率各为0.5

93ac19c777a8ea05dc5d91202bc375ac.png

那么,一个人做了好事的概率P(B)应该为多少呢?我们可以通过把好

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值