博弈论四种类型之完全信息静态博弈

决策需要信息,几乎所有需要决策的场合我们都掌握着有限信息,这使得现实中往往是有限信息博弈。完全信息在这里指的是每个参与人对其他参与人的支付函数有着完全的了解。而静态指的是同时行动的博弈,或者不同时但后行动者不知道之前行动者的决策。
在完全信息静态博弈中的均衡是纳什均衡。最典型的例子是囚徒困境与智猪博弈。下面就由这两个例子展开,并将在博弈论中的一些知识点做出介绍。
【囚徒困境】中基于收益矩阵的模型描述如下:
这里写图片描述
【注】博弈中参与人只拥有有限个离散性的纯战略供其选择称为离散型策略。而在另外一些博弈中,每个参与者的纯策略可以是来自连续范围的一个数,如厂商定价,称为连续型策略。离散型策略静态博弈可以用支付表来表示,如上图。
对于囚徒A与B来说,无论对方采取什么策略,自己的策略是“坦白”时总是比“抵赖”要好些,在两人无法通信的情况下,两人都会选择“坦白”。
【优势战略均衡】在这里,无论对方选择什么,“坦白”的收益是严格大于“抵赖”,所以“坦白”是一个严格优势策略,对应的“抵赖”则是一个劣势策略。所有人都有自己的优势策略,由此产生的优势策略组合是一个优势战略均衡。
但是这里需要注意的是,双方各自的优势策略却导致了集体的利益最差,如果两人都选择“抵赖”收益将是各自-1,但是优势策略下的收益却是-8.囚徒困境反映了个人理性与集体理性的冲突。个人的最优选择从社会角度看并不是最优的。社会生活中有很多例子:公共品的给予,商家的价格战,团队生产中的偷懒(三个和尚没水喝),小学生减负越减越重,各国军备竞赛等。
【如何走出囚徒困境】如果有

  • 3
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值