持续更新中
博弈论简述系列主要参考本校授课老师的PPT,相当于把老师的PPT简单过了一遍,加上自己的理解,但是个人觉得PPT内容系统结构不太行,后面有时间再慢慢调整。
没有什么技术性的内容,主要是简述。后面准备开一个系列,认真研读一下一些技术性的内容。
一、博弈的标准式和纳什均衡
1.1标准式三要素:参与人、策略、收益
1.2占优均衡
注:占有均衡不一定存在,仅在少数博弈中有。例如赛马博弈就没有占优均衡。例子给出,具体自己琢磨。
1.3重复剔除严格劣策略
1.4纳什均衡NE
直观理解:该策略是每个人的最优策略。
数学表达:
上式区别在于s_i有无*号
若对于每个人i,策略都能保证上式成立,那么就称为该博弈的一个纳什均衡(Nash Equilibrium,NE),严格来说这里是纯策略纳什均衡(Pure-strategy Nash Equilibrium, PNE)
关系:
(1)占优均衡肯定是纳什均衡,但纳什均衡不一定是占优均衡
(2)划线法正是在可以用收益矩阵表示的博弈中寻找纳什均衡的方法
(3)
定理
定理1: 如果博弈存在 纳什均衡s*,那么重复剔除严格劣策略法一定不 会将它消去。
证明:反证:假设s*是NE,但被重复剔除严格劣策略法剔除了,不妨设是s*中第一个被剔除的,那么在被剔除的后,一定存在策略使得,与NE定义矛盾。证毕。
定理2:如果重复剔除严格劣策略法排除了除 s*之外的所有策略组合,那么s*一定是该博弈惟一的纳什均衡。
证明:反证:类似上面的思路。
二、一些常见模型
2.1古诺模型
(1)双头垄断的古诺模型
问题:双寡头古诺模型是研究寡头垄断市场的经典模型。
厂商A和B生产同质产品。若A的产量为q1,B 的产量为q2,则市场总产量为Q=q1十q2。设市场价格P与Q的关系为:P=P(Q)=a - Q (当Q<a时,P=a-Q;当Q>a时,P=0)。若两厂商单位生产成本相同c1=c2=c,且无其他固定成本,两个厂商同时决定产量,求纳什均衡产量?
由一阶条件可得解,具体分析后面有时间慢慢整理。
注意:这里求出的均衡点,不一定是使得双方利益最高的点。
挖个坑:反应函数。
2.2伯特兰德寡头模型,Bertrand
2.3霍特林(Hotelling)区位模型
2.4公共资源问题
(1)公共的悲剧问题
有n个农户放羊,公共草地面积有限,因此只能让不超过某一数量的羊群吃饱,若羊只的实际数量超过这个限度,则每只羊都无法吃饱,从而每只羊的产出(毛、皮、肉的总价值)就会减少,甚至只能勉强存活或要饿死。
(2)公共物品的私人供给
三、混合策略和纳什均衡的存在性
3.1混合策略纳什均衡
混合策略:简而言之,就是对于一种纯策略s_i对应着一个概率,即人i以一定概率选择策略s_i,这个概率就是混合策略。
因此只能得到期望收益,而不是精确的收益值。
举例2:A: 0.8 B: 0.2 C: 0.8 D: 0.2
3.2纳什均衡存在性
纳什定理:每个有限策略式博弈均具有混合策略均衡。
注:纯策略均衡是退化的混合策略均衡。
证明:思路是应用角谷不动点定理。
奇数定理 :几乎所有的有限博弈都有奇数个纳什均衡。
定理:若每个参与人的纯策略空间Si是欧氏空间中的一个非空的有界闭凸集,支付函数ui(s) 连续且对si是拟凹的,那么该博弈存在一个纯策略纳什均衡。
定理:若每个参与人的纯策略空间Si 是欧氏空间中的一个非空的有界闭凸集,支付函数ui(s)连续,那么该博弈存在一 个混合策略纳什均衡。
3.3多重纳什均衡
(1)帕累托占优均衡:
(2)风险占优均衡:
(3)聚点均衡:
(4)相关均衡:
(5)颤抖手均衡:
四、二人零和博弈
零和博弈:就是博弈方之间利益始终对立,你赚我赔,我赚你赔,流动的资金就在咱俩之间流动,把咱俩看成一个系统,系统的变化为0。当然这里是以二人为例,实际上对于多人也是一样的道理。
对于甲乙两人,甲的收益矩阵为A,乙就是-A。
求解方法:
(1)最大最小法:
适用于零和博弈的纯策略纳什均衡(列局中人选择该行中数字最小的那一列。行局中人选择在列局中人所选择的这些每行的最小的数字中最大的数字所对应的那一行)
(2)扩展的最小最大方法 (直线交叉方法):
适用于零和博弈的混合策略纳什均衡
(3)线性规划解法:
可设一个期望收益,根据收益的min or max列出一个线性规划的方程组,进行求解。