精炼贝叶斯纳什均衡是博弈论中的一个重要概念。为使逻辑表述方便,我们取二人博弈来讲解。在一般情况下,博弈的双方都有一套属于自己的策略集,像是剪刀石头布一样,博弈双方作为局中人,是不知道在接下来的猜拳中,对方会出哪种手势,但如果知道对方出各种手势的概率,那么自己可以针对对方出各种手势的概率来定出自出哪种手势赢的概率大,如果可以量化的话,可以认为这是使自己的期望收益最大化。
下图是本文框架:
在讲解贝叶斯纳什均衡之前,我们先来看贝叶斯公式和纳什均衡分别是啥。
【贝叶斯公式】
在概率论中,条件概率P(A|B)表示在事件B发生的情况下事件A发生的概率,而先验概率P(A)和P(B)表示事件A、B本身发生的概率。
为了方便理解,我们回想下我们日常生活中是如何判别一个人是好人还是坏人的。
在纯理性的情况下,我们先认定,坏人做好事、好人做好事的概率各为0.5。那么现在提出一个问题:如果我们看到街上有一个人做了好事,他是好人的概率是多少?
如果按照目前的判断,这个概率应该是50%。
但是,日常生活经验告诉我们,好人自然是一定会做好事的,那么我们就有了一个条件概率:
下标B和A对应着公式中的概率P(B|A)
此时我们依然认为坏人做好事的概率为0.5
现在再设定,我们在大街上遇到好人的概率和遇到坏人的概率各为0.5
那么,一个人做了好事的概率P(B)应该为多少呢?我们可以通过把好