本系列文章为笔记,内容根据北京大学《网络与市场中的计算思维》MOOC
更新:一个介绍博弈论的,很有意思的小游戏
https://sekai.co/trust/
何为博弈
“田忌赛马“就是一种博弈
博弈三要素:
- 参与人(玩家)
- 策略集(战略)
- 回报(收益,支付)
博弈论中的博弈不总是讲输赢
例子:明天有一个考试,同时交一个课程报告
两个学生面对的选择:复习功课、准备报告
博弈推理的假定
- 自己的回报是每个参与人关心的唯一因素
- 参与人都是“理性人”,即只要可能,总要选择更好的回报策略
- 每个参与人都对博弈结构完全了解
小结
- 一个博弈,有三个基本要素:参与人、策略、回报
- 博弈论关心的,是博弈的结果,即何种策略组合被参与人(联合)采用
- 为了严格地推理博弈的结果,需要有“理性人”等一些基本假设
何为博弈的解
如果存在一个策略,能够让所有参与人都满意,就称为这个博弈的解
田忌赛马中,就不存在解(每种策略都存在负数)
小结
- 一个博弈的解,是“稳定的策略组”,要求是其中任何参与人不可能通过单方面改变策略而获得更好的回报
- ——”稳定的“在博弈推理假设下不可能再变化
- 不是所有博弈都有解
- 这里解的概念,实际上就是博弈均衡的概念
博弈的求解
- 1严格占优策略:对一个参与人来说,若存在一个策略,无论另一个参与人选择何种策略,该策略都是严格最佳的选择,则这个策略就称为是前者的严格占优策略
- 按照博弈推理假设,参与人将选择严格占优策略
在这个例子中,参与人1的严格占优策略是D,无论参与人2如何选择,都比策略U要好。同理,参与人2的严格占优策略是R
囚徒困境
两人的严格占优策略都是“坦白” 最佳应对
严格与不严格
- U是参与人1的严格占优策略;R是参与人2的占优策略,但不是严格的
- L是U的最佳应对,但不是严格的;R是D的严格最佳应对
小结
- 如果两人都有严格占优策略,可以预计他们均会采取严格占优策略
- 如果只有一个人有严格占优策略,则他会采取,而另一方会采取此策略的最佳应对(一定会有!)
纳什均衡与混合策略
演进思路
纳什均衡
协调博弈
如果两个人走失了,希望互相找到,就会形成以下策略
这个博弈有两个纳什均衡 鹰鸽博弈
- 两个均衡,不能推断到底哪个均衡会出现
- 一般来说,纳什均衡概念能有助于缩小预测范围,但它并不一定能给出唯一的预测
零和博弈——不存在纳什均衡的博弈
硬币配对:双方各持一枚硬币,分别决定出示手中硬币的某一面。若你们硬币的朝向相同,他将赢得你的硬币。反之,你赢得硬币
混合策略
引入随机性,考虑参与人将以一定概率选择策略,一个概率对应一个策略,称为混合策略。
此时,选择策略就是选择概率,而博弈矩阵中给出的选项称为“纯策略”
通常所有策略的概率和为1
先考虑“博弈三要素”
参与人
策略(概率)
回报
此时的策略是概率上的选择,每一组纯策略是对应有固定收益的。因此,从概率意义上出发,此时的收益应该体现一种在两种纯策略上的“平均”(期望)
但是,在研究一个混合策略博弈的时候,我们一般不关心在每个策略下的具体回报,而是关心能否达到均衡?在什么混合策略组下达到均衡
一个博弈,如果没有纯策略均衡,就一定有混合策略均衡
一个博弈,如果有纯策略均衡,还可能有混合策略均衡
小结
- 博弈均衡有两种
- 纯策略博弈
- 混合策略博弈
- 任何博弈都存在均衡
- 可能一个,也可能多个
- 可能是某一种,也可能两种都有
博弈的解与社会最优
社会最优
总福利最大的策略组合
均衡是博弈的解,但不一定是社会最优
从社会学意义讲,均衡与社会最优一致的系统是理想系统
博弈论基本概念总结
- 博弈三要素
- 作为博弈推理基础的三个假设
- 便利博弈推理的几个概念
- 纳什均衡
- 简单混合策略博弈的求解(无差异原理)
- 均衡与社会福利