贝叶斯法则求垄断者阻挠概率的动态博弈问题

贝叶斯法则举例分析

引用贝叶斯法则的举例分析

  1. 第1步 计算P(B):
    挑战者B不知道原垄断者A是属于高阻挠成本类型还是低阻挠成本类型,但B知道,如果A属于高阻挠成本类型,B进入市场时A进行阻挠的概率是20%(此时A为了保持垄断带来的高利润,不计成本地拼命阻挠);如果A属于低阻挠成本类型,B进入市场时A进行阻挠的概率是100%。
    博弈开始时,B认为A属于高阻挠成本企业的概率为70%,因此,B估计自己在进入市场时,受到A阻挠的概率为:

    0.7×0.2+0.3×1=0.44

上面计算结果的推导过程如下:
设事件A表示:企业A属于高阻挠成本企业; 事件B表示:企业A对企业B进行阻挠;
那么:
P(A)=0.7 即事件A的先验概率,不考虑任何条件情况下的初始概率
P(AB) 表示A属于高阻挠成本企业并对企业B进行阻挠的概率:
P ( A B ) = P ( A ) ∗ P ( B ∣ A ) = 0.7 × 0.2 P(AB)=P(A)*P(B|A) = 0.7×0.2 P(AB)=P(A)P(BA)=0.7×0.2
P ( A ˉ B ) P(\bar{A}B) P(AˉB)表示A属于低阻挠成本企业并对企业B进行阻挠的概率:
P ( A ˉ B ) = P ( A ˉ ) ∗ P ( B ∣ A ˉ ) = 0.3 × 1 P(\bar{A}B) = P(\bar{A})*P(B|\bar{A}) = 0.3×1 P(AˉB)=P(AˉP(BAˉ)=0.3×1
因为 AB与 A ˉ B \bar{A}B AˉB是互不相容的事件,因此根据加法法则:
P ( A B ) + P ( A ˉ B ) = P ( A B ∪ A ˉ B ) = P ( B ) = 0.44 P(AB)+P(\bar{A}B)=P(AB\cup \bar{A}B)=P(B)=0.44 P(AB)+P(AˉB)=P(ABAˉB)=P(B)=0.44

所以 0.44表示P(B),即企业A对企业B进行阻挠的概率为0.44
0.44是在B给定A所属类型的先验概率下,A可能采取阻挠行为的概率。

  1. 第2步 计算并更新P(A|B)为新的P(A):
    当B进入市场时,A确实进行阻挠。使用贝叶斯法则,根据阻挠这一可以观察到的行为,B认为A属于高阻挠成本企业的概率变成A属于高成本企业的概率=0.7(A属于高成本企业的先验概率)×0.2(高成本企业对新进入市场的企业进行阻挠的概率)÷0.44=0.32

上面计算结果的推导过程如下:
P ( A B ) = P ( A ) ∗ P ( B ∣ A ) = 0.7 × 0.2 P(AB)=P(A)*P(B|A) = 0.7×0.2 P(AB)=P(A)P(BA)=0.7×0.2
P ( A B ) = P ( B ) ∗ P ( A ∣ B ) P(AB)=P(B)*P(A|B) P(AB)=P(B)P(AB)
∴ P ( A ∣ B ) = P ( A B ) P ( B ) = 0.7 × 0.2 0.44 = 0.32 \therefore P(A|B)=\frac{P(AB)}{P(B)}=\frac{0.7×0.2}{0.44}=0.32 P(AB)=P(B)P(AB)=0.440.7×0.2=0.32

所以0.32表示P(A|B),即事件A的后验概率, 即在发生了企业A对企业B进行了阻挠的情况下,A属于高阻挠成本企业的概率为0.32

  1. 第3步 重新计算并更新P(B)
    根据这一新的概率,B估计自己在进入市场时,受到A阻挠的概率为:
    0.32×0.2+0.68×1=0.744

上面计算结果的推导过程如下:
P(A)由上面初始的0.7更新为: P ( A ) = 0.32 P(A)=0.32 P(A)=0.32 ==(事件A的后验概率)
这里再根据第1步,重新计算P(B)的值:
P ( A B ) + P ( A ˉ B ) = P ( B ) = 0.32 × 0.2 + 0.68 × 1 = 0.744 P(AB)+P(\bar{A}B)=P(B)=0.32×0.2+0.68×1=0.744 P(AB)+P(AˉB)=P(B)=0.32×0.2+0.68×1=0.744

所以P(B)更新为0.744,企业A对企业B进行阻挠的概率为0.744

  1. 第4步 计算并更新P(A|B)为新的P(A):
    如果B再一次进入市场时,A又进行了阻挠。使用贝叶斯法则,根据再次阻挠这一可观察到的行为,B认为A属于高阻挠成本企业的概率变成。
    A属于高成本企业的概率=0.32(A属于高成本企业的先验概率)×0.2(高成本企业对新进入市场的企业进行阻挠的概率)÷0.744=0.086

这里参考第2步骤:
P ( A ∣ B ) = P ( A B ) P ( B ) = 0.32 × 0.2 0.744 = 0.086 P(A|B)=\frac{P(AB)}{P(B)}=\frac{0.32×0.2}{0.744}=0.086 P(AB)=P(B)P(AB)=0.7440.32×0.2=0.086

这样,根据A一次又一次的阻挠行为,B对A所属类型的判断逐步发生变化,越来越倾向于将A判断为低阻挠成本企业了。
以上例子表明,在不完全信息动态博弈中,参与人所采取的行为具有传递信息的作用。尽管A企业有可能是高成本企业,但A企业连续进行的市场进入阻挠,给B企业以A企业是低阻挠成本企业的印象,从而使得B企业停止了进入地市场的行动。
应该指出的是,传递信息的行为是需要成本的。假如这种行为没有成本,谁都可以效仿,那么,这种行为就达不到传递信息的目的。只有在行为需要相当大的成本,因而别人不敢轻易效仿时,这种行为才能起到传递信息的作用。
传递信息所支付的成本是由信息的不完全性造成的。但不能因此就说不完全信息就一定是坏事。研究表明,在重复次数有限的囚徒困境博弈中,不完全信息可以导致博弈双方的合作。理由是:当信息不完全时,参与人为了获得合作带来的长期利益,不愿过早暴露自己的本性。这就是说,在一种长期的关系中,一个人干好事还是干坏事,常常不取决于他的本性是好是坏,而在很大程度上取决于其他人在多大程度上认为他是好人。如果其他人不知道自己的真实面目,一个坏人也会为了掩盖自己而在相当长的时期内做好事。

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值