读书replay《博弈与社会》.2.20190527

前情

《美丽心灵》,一部讲数学家约翰·福布斯·纳什的电影,我第一次听到博弈理论就是在这部电影里。看过电影之后就一直想知道,博弈论究竟讲了什么。很久之后,20190417这天,我刷JD的购物车凑单,看到了由张维迎老师著的《博弈与社会》一书,百度一番发现是本好书,择书不如撞书,就它了。

这本书用了大量的例子来阐述博弈论对人类社会的理解。用张维迎老师的话说就是:“……我将使用博弈论(game theory)的方法从人际互动的角度来考察人的行为”。张维迎老师在阐述博弈论方法论的地方还说到一个点,我觉得很有意思:“实际上,所有的社会科学都可看成是有关人类行为的科学,它们旨在揭示人类行为的规律,特点和影响。当然,不同学科的视角,方法以及前提假设可能大相径庭。在这些学科当中,有着鲜明特色的方法论的学科主要有三种:经济学,社会学,心理学。”这表示,对人类行为的研究基本就是架设在经济学,社会学,心理学三个学科上,当然可能还有其他一些旁的学科,这是我此前没有意识到的一个点。

《社会与博弈》的内容相当丰富,有很多对社会史实的讲解,感兴趣的同学应该入手一本自己阅读一下,对我而言replay的价值在于记录一些我认为重要的,有意思的概念。所以我会从概念的角度出发,混合自己的理解和想法去写。而更多更丰富的内容我也只能望尘莫及啦。

概念

博弈论的假设

很多理论都有基本假设,比如相对论假设真空中光速不变,博弈论则假设:

  • 参与人是工具理性的

  • 工具理性是所有参与人的共同知识

  • 所有参与人都了解博弈的规则

这里引出了另一个概念:工具理性。工具理性指的是,一个人要有明确的偏好,并在给定条件下,一定追求偏好的最大满足。明确偏好也有定义:偏好要具有可比较性,以及传递性,才被认为是明确偏好。比如你认为桃子比苹果好吃,苹果比梨好吃,并且你认为桃子比梨好吃,你的这个偏好才是明确的。

工具理性是所有参与人的共同知识(简称:理性共识),可以简单的理解为,我是理性的,而我知道你也是理性的。理性共识有阶次的概念,比如零阶,所有参与人都是理性的,但是不知道其他人是否理性;一阶,参与人知道其他人是理性的;二阶,参与人知道其他人知道自己是理性的;以此类推到N阶。

参与人都知道博弈规则,这个就是字面意思,大家都知道游戏规则。

帕累托最优

帕累托最优又称帕累托效率,它是由意大利经济学家帕累托在一百多年前提出的。帕累托最优指的是这样一种社会状态,没有人可以在不降低其他人处境的前提下实现增长。帕累托最优比较僵硬,就算我实现了100的增长,而只造成了你1的倒退,那这个状态也不是帕累托最优。

卡尔多——希克斯改进

由于帕累托最优的僵硬,卡尔多和希克斯提出了新的标准:受益者的所得如果可以弥补受损者的损失,那它就是一个卡尔多——希克斯改进。

法律上有一个“汉德法则”,它就是卡尔多——希克斯改进的一种解释。

完美信息

完美信息指的是,你知道对手的一举一动。比如下棋。

完全信息

完全信息指的是你掌握对方的特征。比如你知道你的对手是一个刚入门的菜鸟。

静态博弈

参与人行动时,不知道对手采取了什么行动。比如划拳。

动态博弈

参与人行动时,知道对手采取了什么行动。比如打牌。

这时如果有人提出了一个词叫:完全信息动态博弈。我想你就应该能理解是什么意思了。

战略

战略这个词,我常听,但它的明确定义,我还是在这本书里才看到的,而且看到后我才知道,战略是要规定时间的!书中这样写道:“战略是行动的规则,它要为行动规定时机……战略要具有完备性,就是说针对所有可能的情况,都要制定相应的行动计划。”

占优战略

一般参与人的最优选择都会依赖其他参与人的选择,但是有些情况下,不管你的对手选择什么,你都只有一个最优选择,此时这个最优选择就被叫做“占优战略”。

纳什均衡

纳什均衡指所有人都处在最优选择上。不过不要把它和帕累托最优搞混。纳什均衡下的参与人最优选择是从参与人角度来看的,比如你我迎面走去,我认为你会靠右行(我国的社会规范提倡靠右行走),于是我也选择靠右行。而你也认为我会靠右行,于是你也靠右行,于是我两安全交会,谁也没撞到谁,我是最优选择,你也是最优选择,此时我两的选择就组成了纳什均衡。如果一个英国人迎面向我走来,我和他就无法构成纳什均衡。从这个例子你也能看出来,在一个场景下可以有多个纳什均衡,比如两个英国人,都靠左走,这也是一个纳什均衡。

博弈

书中描述了很多博弈,包括虚构的,真实的。这里我将replay几个重要的博弈。

囚徒困境博弈

“囚徒困境”是社会合作面临的基本问题。包含了丰富的内容,几乎所有的博弈理论都由此发展,可以说我们从始至终都要不断地涉及它

可见囚徒困境博弈有多么重要。囚徒困境是这样的:

两个犯罪嫌疑人共同作案,警察抓住了他们,分开拘押,他们可以选择坦白,或者不坦白;如果一个人坦白,另一个不坦白;则坦白的一方将被立即释放,不坦白的一方被判10年监禁;如果都坦白,则各判8年;如果都不坦白,则因证据不足,各判1年。

简单分析一下,罪犯A不知道罪犯B是否坦白,那么罪犯A应该选择什么?假设罪犯A不坦白,那么罪犯B坦白,A将被关10年,罪犯B不坦白,A将被关1年;假设罪犯A坦白,那么罪犯B坦白,A将被关8年,罪犯B不坦白,A将无罪释放。所以A将面临一个占优战略,那就是坦白!B的情况是一样的。问题出现了,这个博弈的帕累托最优是两人都不坦白,这样各关一年,个人理性和集体理性在这里发生了冲突。这是博弈论研究的一个重要支点,现实社会中很多我们嗤之以鼻的现象,就是个人理性与集体理性冲突导致的。

作者举了几个例子:

广告,企业发广告会降低自己的利润,但如果别人发广告,你不发,你就会因为失去市场份额而难以存活,所以你只能发广告,这最终导致大家的利润都降低,而集体理性的做法是大家都不发广告。

又比如军备竞赛,军备竞赛会增加国家负担,但如果你不发展军事,你就会陷入危险境地,所以你只能加入军备竞赛,而集体理性的做法是大家都不发展军事。

还有公共产品。公共产品指国防,道路,桥梁等等的公共服务或设施。与公共产品对应的是私人物品。私人物品具有排他性,你在穿的衣服其他人就穿不了,而公共产品没有排他性,你行驶的公路,其他人也可以行驶,由于没有排他性,人们更乐意去搭公共产品的便车,于是都没有积极性去生产公共产品。因此公共产品的囚徒困境是公共治理的核心问题,对一个社会来说极其重要。

社会中人们签订合同,预先拟定赔偿方案,就是为了走出囚徒困境,让双方合作成为各自的最优选择,增加合作双方的合作意愿。

智猪博弈

智猪博弈是大猪小猪觅食问题,大猪去觅食,小猪蹭吃,那么大猪收益4,小猪收益2;小猪觅食,大猪蹭吃,那么小猪收益-1,大猪收益6;大小猪同时觅食,大猪收益5,小猪收益0;大小猪都不觅食,各自收益都为0。你不用在意这里出现的数字,数字是多少无所谓,你只需要知道这样一个核心道理:小猪觅食收益都很低,它最好的策略是蹭吃;而大猪虽然蹭吃有很高的收益,可如果小猪也不觅食,那它就一无所获,而大猪如果选择觅食的话,无论小猪是否自己觅食,大猪的收益都不错。

智猪博弈其实解释了很多社会现象。比如村里的大户人家出资修路,修路能增加大户人家的产能,所以他有这个意愿。比如国际反恐,反恐成本是很高的,美国为什么在反恐问题上有那么高的积极性,因为他在反恐中能获得收益,而小国也讨厌恐怖分子,但他们没有积极性。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值