博弈论入门

数学基础

条件概率公式

在这里插入图片描述

全概率公式

在这里插入图片描述

贝叶斯公式

在这里插入图片描述

先验概率和后验概率

  • 先验概率:根据经验和分析,实验或采样前得出概率,概率分布确定
    • 出门前知道发生交通事故计算堵车概率
  • 后验概率:某件事已经发生,计算这件事发生的原因是由某个因素引起的概率
    • 遇到堵车,计算由交通事故引起的概率

信号博弈signal game

  • 包含两名参与者:信号发送者(sender)和信号接收者(receiver),信号发送者首先行动,向信号接收者发送一个关于自身类型的信号,信号接收者收到信号后根据信号的内容选择行动。
类型:
  • 有两个依次进行阶段,是动态博弈
  • 发送者类型仅由发送者知道,接收者不知道,是不完全信息博弈
    • 海萨尼转换可将博弈变为信息完全但不完美的博弈

发送者

信号发送:
  • 拥有信息的参与者通过某种行动向对手展示自己真实信息(对方知道对自己有利)
信号干扰:
  • 例如成绩差的学生希望通过采取合格/不合格两种模式进行成绩评定已达到鱼目混珠的目的(没有利)

接收者

  • 接收到对方信息对自己有利时会想方设法甚至设置机制获取信息
  • 接收到对方私人信息对自己不利时则会避免受到信息,例如:老师就不想知道迟到同学的各种理由

分离均衡(separating equilibria):

  • 如在市场完全成功型的均衡中,商品质量好的卖方将商品投放市场,而商品质量差的卖方则不敢将商品投入市场,这时卖方的行为完全反映他销售商品的质量,这种均衡能把不同类型的卖方完全区分开来。
  • 说白了就是能很好的分离开优劣
    在这里插入图片描述
    在这里插入图片描述
激励相容约束
  • 对于高能力者,他获得的最终收益要大于等于地能力者才会驱使他进行学习n门课,即: 32 − 0.6 n > = 12 32-0.6n>=12 320.6n>=12
  • 对于低能力者,他获得的工资要大于等于欺骗成为高能力者获得的收益,才会使他老老实实摆烂,即: 12 > = 32 − 3 n 12>=32-3n 12>=323n
参与约束
  • 在极力相容约束的条件下,要让求职者愿意来这里工作,即来这里工作的工资要高: 32 − 0.6 n > = 25 32-0.6n>=25 320.6n>=25 12 > = 6 12>=6 12>=6

同时满足四个式子时,解得 20 / 3 = < n < = 70 / 6 20/3=<n<=70/6 20/3=<n<=70/6,即将n=7,再大没有意义。

混同均衡(Pooling Equilibrium)

  • 知乎上看的: 小磊长大了,变得特别争强好胜,又回忆起小学时候偏心老师不公的处罚,十分气愤。所以他非常想和小梅比一比成绩。不过,也正是因为小磊特别争强好胜,他只打算在有把握自己成绩比小梅高时,才和小梅比成绩。小梅也长大了,并不想和小磊比成绩,觉得小磊很幼稚,不想和小磊打交道。
  • 高中老师是个随缘老师,不想让学生们攀比成绩,还认为成绩属于学生隐私,因此从来不公布成绩。这就导致小梅和小磊彼此不知道对方的成绩。有一次测验之后,小磊考了个高分,脸上喜气洋洋。不过小磊不知道小梅考得怎么样,于是决定观察小梅的表情,来推测小梅的成绩。其实小梅这次发挥失常了,考得不怎么样。但她因为不想让小磊过来比成绩,所以也假装一副喜气洋洋的样子。小磊看小梅的表情,觉得小梅的成绩未必比自己低,就没敢找小梅比成绩。这就是混同均衡,小梅、小磊成绩不一样,但却发送了相同的信号(表情)。
    在这里插入图片描述
  • 当高能力占比60%时,此时,企业预期的收益为: 60 % ∗ 32 + 40 % ∗ 12 = 24 60\%*32+40\%*12=24 60%32+40%12=24
    • 即企业会支付24w的报酬
    • 而在分离均衡中,高能力者能够获得 32 − 4.2 = 27.8 32-4.2=27.8 324.2=27.8的收益,比混同均衡收益更高
  • 当高能力占比80%时,此时,企业预期的收益为: 80 % ∗ 32 + 20 % ∗ 12 = 28 80\%*32+20\%*12=28 80%32+20%12=28
    • 此时,对于高能力者,还不如不修

此模型中没有混同均衡,因为高能力者会和企业商量通过自身多修一门课加1w工资,逐渐到达7门课进入分离均衡

贝叶斯劝说Bayesian perusasion

举例:

在这里插入图片描述
在这里插入图片描述

  • 我们整理下这个例子:

    • 真实为好的概率为0.3,即 P r ( s = g ) = 0.3 Pr(s=g)=0.3 Pr(s=g)=0.3
    • 真实为差的概率为0.7,即 P r ( s = b ) = 0.7 Pr(s=b)=0.7 Pr(s=b)=0.7
    • 真实为差但报告为差的概率为 P r ( r = b ∣ s = b ) = 4 7 Pr(r=b|s=b)=\frac{4}{7} Pr(r=bs=b)=74
    • 真实为差但报告为好的概率为 P r ( r = g ∣ s = b ) = 3 7 Pr(r=g|s=b)=\frac{3}{7} Pr(r=gs=b)=73
  • 那么当报告是好的时候,真实也是好的概率是多少呢?
    P r ( s = g ∣ r = g ) = P r ( s = g ∗ r = g ) P r ( r = g ) = P r ( r = g ∣ s = g ) ∗ P r ( s = g ) P r ( r = g ∣ s = g ) ∗ P r ( s = g ) + P r ( r = g ∣ s = b ) ∗ P r ( s = b ) = 0.5 Pr(s=g|r=g)=\frac{Pr(s=g*r=g)}{Pr(r=g)}=\frac{Pr(r=g|s=g)*Pr(s=g)}{Pr(r=g|s=g)*Pr(s=g)+Pr(r=g|s=b)*Pr(s=b)}=0.5 Pr(s=gr=g)=Pr(r=g)Pr(s=gr=g)=Pr(r=gs=g)Pr(s=g)+Pr(r=gs=b)Pr(s=b)Pr(r=gs=g)Pr(s=g)=0.5

  • 真实也是好的概率达到50%。

  • 而根据全概率公式,可以得到报告说好的概率高达60%
    P r ( r = g ) = P r ( r = g ∣ s = g ) ∗ P r ( s = g ) + P r ( r = g ∣ s = b ) ∗ P r ( s = b ) = 0.6 Pr(r=g)=Pr(r=g|s=g)*Pr(s=g)+Pr(r=g|s=b)*Pr(s=b)=0.6 Pr(r=g)=Pr(r=gs=g)Pr(s=g)+Pr(r=gs=b)Pr(s=b)=0.6

  • 而投资者的后验概率为50%,因此在看到这份报告后会去投资
    (这块感觉有点懵,先记下)

参考资料

  1. 先验概率跟后验概率(通俗易懂)
  2. 信号博弈signaling game
  3. 5.5.1-博弈论-不完全信息动态博弈-信号博弈与信息传递
  4. 怎样深入浅出地解释「精炼贝叶斯均衡」的概念?
  5. 贝叶斯劝说 引例
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值