《微观经济学》博弈论入门:囚徒困境、智猪博弈、性别战、斗鸡博弈

《微观经济学》囚徒困境、智猪博弈、性别战、斗鸡博弈

前言

今天上了一节微观经济学的课,十分精彩,超出我的预期。我自己看书完全get不到要点,看PPT也看得零散,老师一讲,博弈论在我脑海中就构建得很清晰。

《微观经济学》的期中总结(前七章)

《微观经济学》第八章 博弈论与寡头市场初步笔记

下面我打算通过这四个故事来讲一讲完全静态博弈,当然在此之前,我会把博弈论的知识框架搭建出来,方便有前置了解。

笔记

前置知识

博弈论知识结构

解释:

博弈论中有两块内容:一个是理论,一个是应用。

在理论部分根据决策者的决策方式分为三种:完全理性、有限理性、完全非理性;完全理性指总是追求利益最大,有限理性指既追求利益又考虑情感,完全非理性指动物的博弈,纯追求直觉;

在完全理性的博弈论中分为合作博弈和非合作博弈。

在非合作博弈中,根据信息是否所有人知道,分为完全信息与不完全信息;根据决策是否根据对方决策会变动分为静态博弈与动态博弈。

完全信息静态博弈:如猜硬币正反面

完全信息动态博弈:如下象棋;

不完全静态博弈:如招聘;

不完全信息动态博弈:如斗地主、三国杀

博弈论知识结构

书本知识框架

我使用的教材是《微观经济学》(张雪峰)2020年6月第一版。

书本上重点讲博弈论理论中的完全理性部分的内容以及博弈论的应用。

第十二章 博弈论与信息经济学

博弈论发展史

给我们上课的老师是张雪峰,也是编这本书的老师,研究领域是博弈论,清华博士。

起步

  • 1838年古诺寡头模型。
  • 1883年伯特兰德寡头竞争模型。
  • 1913年蔡梅罗象棋博弈定理 、“逆推归纳法”,零和有穷的双方博弈,一定有一方拥有总赢的策略。
  • 1928年诺伊曼和摩根斯坦恩扩展形博弈定义,证明有限策略两人零和博弈有确定结果。

正式定义

  • 1944年,冯.诺伊曼和摩根斯坦恩《博弈论和经济行为》引进扩展式(extensive form)表示和规范式(normal form)。
  • 1952-1953年,Shapley和Gillies提出“核”(Core)作为合作博弈的一般解概念。
  • 1953年,Shapley提出了合作博弈的“Shapley值”(Shapley value)概念等,特点:强调团体理性、效率、公正、公平。

成熟

  • 1950年,1951年纳什提出“纳什均衡”(Nash equilibrium)概念和证明纳什定理,成为非合作博弈的基础理论。
  • 1950年,Tucker(杜克)定义了囚徒困境
  • 1950年,Melvin Dresher和Merrill Flood在兰德公司进行 “囚徒困境” 博弈实验

特点:强调个人理性、个人最优决策。

巅峰

  • 1965年,泽尔腾(Selten) 引入动态分析,提出“子博弈完美纳什均衡”(subgame perfect Nash equilibrium),1975年提出“颤抖手均衡”(Trembling hand perfect equilibrium)。
  • 1967-1968,海萨尼(Harsanyi)引入不完全信息, 提出“贝叶斯纳什均衡”(Bayesian Nash equilibrium)。
  • 1982年,克瑞普斯(David M. kreps)和威尔孙(Robert Wilson)讨论不完全信息下的动态博弈,提出“序贯均衡”(Sequential equilibria)。
  • 1991年,弗得伯格(D. Fudenberg)和泰勒尔(J. Tirole)首先提出了“完美贝叶斯均衡”(Perfect Bayesian quilibrium)的概念。

高潮

2007年诺贝尔获奖

利奥尼德-赫尔维茨(Leonid Hurwicz)赫尔维茨,美国明尼苏达大学经济学名誉教授。

埃里克-马斯金(Eric S.Maskin)马斯金为普林斯顿大学社会科学院高等研究院教授。

罗杰-迈尔森(Roger B.Myerson)迈尔森目前为芝加哥大学经济系教授。

获奖原因:机制设计理论,重复博弈,收入不均衡问题以及投票理论。

未来

2016年诺贝尔获奖

哈佛大学的奥利弗·哈特(Oliver Hart)

麻省理工的本特·霍姆斯特罗姆(Holmström)奥利弗·哈特

机制设计:他们获奖理由与契约理论有关,契约理论目标之一是要解释为什么合同有各种形式和设计。

《微观经济学》,张雪峰,2020年5月出版。

如果说博弈论是一场电影,那电影的主演就是参与者,包括委托人(Principal)与代理人(Agent),导演就是机制设计者(Mechanism Designer),给定电影预想达到的目标,机制设计者导演(设计)了博弈的结构,包括行动的顺序、信息的结构等等,委托人与代理人在导演设计的博弈结构中选择自己的行动或策略,实现自己人生的价值——均衡。

纳什均衡就像男主角委托人与女主角代理人爱情的结晶,第一个孩子叫占优均衡,第二、三、四个孩子叫子博弈精炼纳什均衡、贝叶斯均衡、精炼贝叶斯均衡等等,有时还会收养一些其他孩子:可理性化策略、序惯均衡、颤抖手均衡等。

非合作博弈分类

image-20201124102847455

基本概念

博弈论与经济学的关系

  • 研究模式是一样的:在给定的约束条件下,追求个人利益最大化
  • 都是研究个人最优决策的
  • 强调个人理性

博弈论与经济学的区别

(1)研究方法和思路不同

经济学:个体决策

博弈论:策略性互动

(2)假设不同

经济学:信息完全与市场出清

博弈论:非对称信息

博弈论在经济学中的应用

  • 博弈论主要应用领域:寡头市场分析、企业管理、资本市场分析、不完全信息领域、机制设计。
  • 经济学研究的对象越来越转向个体,放弃了一些没有微观基础的假定,如消费函数,投资函数。
  • 从个人效用函数和约束条件出发进行研究,试图建立宏观经济学的微观基础。
  • 经济学研究越来越重视人与人之间的关系。
  • 通过“机制设计”和“制度安排”来解决“个人理性”与“集体理性”的矛盾。
  • 经济学研究越来越重视信息的影响,特别是信息不对称对个人选择及制度安排的影响。——信息经济学。

博弈论的基本概念

  1. 参与人:指博弈中的决策主体,他的目的是通过选择行动(或战略)以最大化自己的支付(效用)水平,参与人可以是个人、团体、自然(“上帝”作为虚拟的参与人)
  2. 行动:参与人的决策变量
  3. 策略:参与人选择行动的规则
  4. 信息:参与人在博弈中的知识,特别是关于对手的特征和行动的知识
  5. 支付函数:参与人从博弈中获得的效用水平,是所有参与人战略或行动的函数
  6. 结果:博弈分析者感兴趣的要素的组合
  7. 均衡:所有参与人的最优战略或行动的组合

静态博弈与动态博弈

(1)静态博弈:同时行动,或彼此不能观测对方

(2)动态博弈:行动有先后,后者能观测前者

完全信息与不完全信息

(1)完全信息博弈:彼此知道对方的特征,战略空间及支付函数。

(2)不完全信息博弈:至少有一方不知道。

公共知识(完全信息)

共同知识涉及一群体对某事实知道的结构;一般在n人博弈中中,如果群体中每个人知道p,且每个人知道其他人都知道p ,每个人都知道其他人都知道自己知道p,……,则称p是共同知识。

经典博弈模型

智猪博弈

占优战略以及重复剔除严格劣战略的一种博弈决策。也称为重复剔除严格劣战略的占优战略均衡

猪圈里有两头猪:大猪和小猪,猪圈的一头有一个猪食槽,另-头装有-个按纽,控制着猪食的供应,按一下就会有10单位的猪食进槽,但谁按谁就要付出相当于2单位猪食的成本。当猪食进槽时,若大猪先到,大猪可吃到9单位;小猪先到;则小猪可吃到4单位,大猪吃6单位;若两者同时到,则大猪可吃7单位,小猪吃3单位。

image-20201124103737065

如果小猪去按,大猪就会等;如果大猪去按小猪就会等;

假设大猪按的情况,小猪的最优策略就是等;假设大猪等的情况,小猪的最优策略还是等;最终小猪的最优策略还是等,于是大猪面对这种最坏的情况,会选择最优策略——按。

image-20201124104414840

在现实生活中的使用:

(1)企业:大股东与小股东

(2)股票市场:大户和小户

(3)修路:富人与穷人

(4)改革开放:改革派与保守派

(5)发展:发达国家和发展中国家,后发优势

(6)技术研发:新冠病毒下,省级CDC与县级CDC

启示:现实生活中,优势方有时候会为了让自己赢的较高收益,会理性忍受不均衡摊派;

性别战

纯战略的拓展——混合战略博弈的例子

image-20201124104432611

image-20201124104445629

启示:和则两利;

斗鸡博弈

image-20201124104709379

总结:礼让行人

总结

静态博弈常用规范式(表结构)来描述博弈;动态博弈用扩展式(树结构)描述博弈;

虽然我们上的是微观经济学的课,不过我们老师研究领域是博弈论,所以会重点介绍博弈论。

他的课程安排是市场理论和博弈论两个部分,

image-20201124104949798

image-20201124105006166

暂时写到这。

更新地址:GitHub

更多内容请关注:CSDNGitHub掘金

  • 5
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 13
    评论
评论 13
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值