耶鲁大学《博弈论》课程——最佳对策

最佳对策 Best Response

定义:当参与者i的策略si对于所有其他策略si’,有U1(si,s-i)>=U1(si’,s-i),此时策略si是对手的策略s-i的最佳对策

这是一个只有两个人参加的简单博弈,参与者1有U,M,B三种策略,参与者2有L,R两种策略,两人的收益如表中所示:

image-20230116154356905

这种情况下对于两位参与者没有严格优势策略和劣势策略。

我们设Px为对手(参与者2)选L的概率。

PU = Px * 5 + 0 * (1 - Px) = 5 * Px
PM = Px * 1 + 4 * (1 - Px) = 4 - 3 * Px
PB = Px * 4 + 2 * (1 - Px) = 2 + 2 * Px
image-20230116154520419

所以,当Px<2/5时选择策略M,当2/5<Px<2/3时选择策略B,当Px>2/3时选择策略U。

这个时候估计对方选择L的概率很重要。

点球】案例:

在一次足球比赛罚点球时,罚球队员可以选择L,M,R三种不同射门路径;门将可以选择扑向左路或者右路(原则上讲他也可以守在中路)。

image-20230116164838738

上表表示各自的收益,其中,Lr对应的9表示当射手射向左路而门将扑向右路时,射手有90%的概率进球,-9表示门将有90%的概率丢球(10%概率射偏)。其他收益以此类推。

我们假设门将扑向右路的概率是Pr,那么门将扑向左路的概率是Pl=1-Pr。那么,射手:

	选择左路的预期收益为 EU1(L,Pr) = Pl * U1(L,l) + Pr * U1(L,l) = (1-Pr) * 4 + Pr * 9 = 4 + 5 * Pr;
	选择中路的预期收益为 EU1(M,Pr) = Pl * U1(L,l) + Pr * U1(L,l) = (1-Pr) * 6 + Pr * 6 = 6;
	选择右路的预期收益为 EU1(R,Pr) = Pl * U1(L,l) + Pr * U1(L,l) = (1-Pr) * 9 + Pr * 4 = 9 - 5 * Pr;
image-20230116165022061

结论:从中路射门永远都不是一个最佳策略。不要选择在任何信念下都不是最佳策略的策略。

合伙人博弈】案例:

两个参与者都是公司的股东,他们都持有公司的50%股份。

si表示第i个股东为公司付出的精力,i=1,2。

总收益为4 * (s1 + s2 + B * s1 * s2),B是协同程度,所以对于每个参与者,他们能够获得的收益是1/2 * 4 * (s1 + s2 + B * s1 * s2) = 2 * (s1 + s2 + B * s1 * s2)。

我们现在来考虑参与者1,他的付出是s1^2,所以他的净收益为:2 * (s1 + s2 + B * s1 * s2) - s1^2。为了让收益最大,对s1求导得出收益导数为0的方程:s1 = 1 + B * s2。

同理,对于s2,s2 = 1 + B * s1。

我们这里设B=1/4,S=[1,4]。

image-20230116191540128

这里可以看到,因为s1的范围只在1和2之间,所以[0,1]和[3,4]是s1的劣势策略(无论如何都取不到最大收益);同理,[0,1]和[3,4]是s2的劣势策略。

所以剔除之后剩下了s1∈[1,2],s2∈[1,2]这个区间,我们将其放大四倍,发现了和原来一样的图。然后我们就可以接待进行剔除了…

最后得到的最优点就是方程组:s1 = 1 + B * s2,s2 = 1 + B * s1(潜在条件s1 = s2)的解。得出:s1 = s2 = 1/(B-1)。我们把(1/(B-1), 1/(B-1))这个点称为【纳什均衡 Nash Equilibrium】。这意味着博弈双方彼此都不想偏离纳什均衡点,在纳什均衡点处,双方都采取彼此的最佳对策。合伙人博弈

(补充:但实际上,很难真正的达到这个最优点,为什么呢? => 问题出在了边际量上,当你参与了工作并承担了边际成本,你承担了多付出的全部边际成本,却只能获得一半的边际收益,这会使你减少付出,对其他人,也都是这么想的。简单来说就是,“我的付出不仅使我受益了,同样也会让其他人受益”

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值