博弈论笔记（本科）

拔剑吧！

于 2022-01-06 17:55:08 发布

阅读量483

点赞数 1

分类专栏：经济学课程学习

本文链接：https://blog.csdn.net/weixin_48642879/article/details/122349460

版权

经济学课程学习专栏收录该内容

9 篇文章 10 订阅

订阅专栏

文章目录

博弈论笔记
别忘记细节
入门
Introduction
Prisoner's Dilemma
Nash Equilibrium
- - Oligopoly
  - Unit demand
信息完全博弈
- - Stackberg duopoly
长期关系
不完全信息动态博弈
拍卖理论
signaling

博弈论笔记

教材：（不确定，都可以）
Reference:
Osborm an introductory to game theory
Dixit and skeath,games of strategy
Gibbons,A Primer in Game Theory
Binmore Playing for Real:AText on game theory

评分：
participation(10%) + homework(10%) +project +presentation(20%) +final (50%)
考试题目用英文

presentation
博弈论案例或者问题，有趣的博弈问题

project

1000字（俚语俗语语言中的博弈论

别忘记细节

求纳什均衡的三种方法，剔除严格劣策略，画博弈矩阵，最优反应函数
描述一个博弈需要包括： player ; game tree(timing) , 终端历史；每个时间段或者历史对应的玩家p(h)={1}；pay off ；不确定性，确定的信念。（不需要描述策略，如果是静态博弈就把timing改成action）
不完全信息是对谁来说一定要弄清楚，不要把二者弄混淆这样就会错的。
剔除劣策略时，也要注意是看哪个payoff，这个payoff找错了，会发生剔除错的！！！一定要看清楚是哪个比哪个大，行比较列，列比较行！！！
策略需要把不完全信息加上去！！！所以就有很多啊！！！
贝叶斯均衡怎么描述qwq
博弈的扩展式就是博弈树，博弈的战略式就是博弈矩阵
概率论两个随机变量的和差
有范围的记住说一下范围，别忘啦

入门

9.13
博弈论是多人决策的问题

要素
players, choices,payoffs
timing
information

静态博弈
动态博弈

完全信息博弈
不完全信息博弈

囚徒困境，信号博弈，勇士博弈，谈判，上下游，拍卖，寡头
静态完全信息博弈，不完全信息动态博弈，动态完全信息博弈

解概念

占优策略，纳什均衡，贝叶斯均衡等

Introduction

game theory: 博弈论提供了正式研究互动策略的一系列工具。

strategic interaction: 多人决策每个人的报酬都取决于其他人的策略

一些博弈：讨价还价寡头竞争拍卖商业政策外交军事冲突

博弈语言

players choices payoffs timing information

完全信息动态博弈完全信息静态博弈不完全信息动态博弈不完全信息静态博弈

完全信息静态博弈

The set of players: $N=\{1,2,\dots ,n\}$

player i’s feasible choices : $A_i$

Player i’s payoff function: $u_i:A_1\times A_2\dots \times A_n\to R$

解概念

dominance 占优

纳什均衡

背景介绍

贝叶斯均衡等等

Prisoner’s Dilemma

囚徒困境：个人理性与社会最优相矛盾

占优策略，选择这个严格比另一个策略好

comments:

payoff and modeling; rationality assumption

囚徒困境的例子：

团队工作军事竞赛密谋勾结公共资源（教育医疗排污环境）

解决方式：国家长期合作第三方

Dominance

players choices payoff
$players:\{1,2,\dots ,N\}\\player ~i's~ choices:\{A_i\}\\player ~i's ~payoff:u_i:A_1\times \dots \times A_n\to R$

$a=(a_1,a_2,\dots ,a_n)\\ a_{-i}=(a_1,a_2,\dots ,无a_i,a_{i+1},\dots,a_n)\\ A_1\times A_2=:\{(a_1,a_2)|a_1\in A_1,a_2\in A_2\}\\ A_1\times \dots \times A_n=;\{(a_1,a_2,\dots,a_n)|a_i\in A_i,i=1,2,\dots\}\\ A \quad A_{-i} \quad a\in A\quad a_{-i}\in A_{-i}$

Dominance

$a_{i}$ (strictly) dominates $b_{i}$ if
$u_{i}\left(a_{i}, a_{-i}\right)>u_{i}\left(b_{i}, a_{-i}\right) \quad$ for all $a_{-i} \in A_{-i}$ .

b被占优，a是占优策略如果占优其他所有的行动

理性参与者不会采用劣势策略

劣势策略可以从考虑中消除

囚徒困境：每个人的占有选择导致的结果是社会次优的

Iterated Dominance（迭代的主导地位

逐步剔除被占优策略

占优可求：如果剔除的极限得到的集合是一个单元素集合

common knowledge of rationality

common knowledge: 我知道，你知道我知道，我知道你知道我知道，……

common knowledge of rationality：理性的共同知识

共同知识有更新，人们对理性的理解有更深一步的了解

Nash Equilibrium

Coordinated attack

没有期望报酬
期望去or不去
第一轮决定了后面的收敛结果：若第一次成功袭击，后面也会袭击，否则就不会袭击了

纳什均衡

$\left(a_{1}, a_{2}, \ldots, a_{n}\right)$ is a Nash equilibrium

if $u_{i}\left(a_{i}, a_{-i}\right) \geq u_{i}\left(a_{i}^{\prime}, a_{-i}\right)$ for all $a_{i}^{\prime} \in A_{i}$ and all $\in N$ .

pre-play communication

只有商量的结果是纳什均衡才会被大家遵守

最优反应函数

$a_{i}$ is a best response to $a_{-i}$ if
$u_{i}\left(a_{i}, a_{-i}\right) \geq u_{i}\left(a_{i}^{\prime}, a_{-i}\right) \quad for~ all ~a_{i}^{\prime} \in A_{i} .$

$B_{i}\left(a_{-i}\right)$ : the set of best responses to $a_{-i}$ .

纳什均衡的最佳反应函数解法

$\left(a_{1}, a_{2}, \ldots, a_{n}\right)$ is a Nash equilibrium iff

$a_{i} \in B_{i}\left(a_{-i}\right), \quad$ for all $i .$

零和博弈：唯一的纳什均衡唯一的报酬

给定一个博弈一定存在混合策略的纳什均衡，不一定存在纳什均衡

Oligopoly

卖方寡头垄断

条件：厂商少

战略互动的突出例子

古诺博弈：决定产量

反垄断的方法：

谈判，坦白
判断价格更接近垄断还是竞争

囚徒困境：

垄断并购
违约
长期博弈（无穷维度）

伯川德博弈：决定价格

Unit demand

$n$ products: $\ldots, n$
Values: $\left(v_{1}, \ldots, v_{n}\right) \sim F \times \cdots \times F .$
Demand under prices $p=\left(p_{1}, p_{2}, \ldots, p_{n}\right)$ :
$Q_{i}(p)=\operatorname{Pr}\left(v_{i}-p_{i}>v_{j}-p_{j}\right.$ for all $\left.j \neq i\right) \cdot 1$
Profit:
$\pi_{i}(p)=\left(p_{i}-c_{i}\right) Q_{i}(p)$
求纳什均衡和串谋时的决策

信息完全博弈

打牌公开叫价信号+博弈

威胁承诺（信誉）谈判（讨价还价）报仇

完全信息博弈：采取行动时知道所有之前的行动

A tree $T$ is a set of finite sequences such that
$\left(a^{1}, \ldots, a^{k}, a^{k+1}, \ldots, a^{m}\right) \in T \Longrightarrow\left(a^{1}, \ldots, a^{k}\right) \in T~for~ all ~k<m$
Capture all possible sequences of actions

T的序列叫做历史

$ \emptyset \in T$：初始历史

N：终端历史

完全信息动态博弈包括：

a set of players $I=\{1,2, \ldots, n\}$ ,
a tree $T$ with terminal sequences $N$ ,
a player function $\ N → I P: T \backslash N \rightarrow I$ ,
a payoff function $u_{i}: N \rightarrow \mathbf{R}$ for each $\in I$ .

Stackberg duopoly

行动的定义

Actions available to the player who moves after $h$ :
$\equiv\{a \mid(h, a) \in T\} .$
策略的定义

A strategy $s_{i}$ for player $i$ specifies an action
$s_{i}(h) \in A(h)$
for each $h$ such that $P (h) = i$ .

完整的终端历史 $\equiv\left(a^{1}, a^{2}, \ldots, a^{m}\right)$

A strategy profile $s$ is a Nash equilibrium if
$u_{i}\left(O\left(s_{i}, s_{-i}\right)\right) \geq u_{i}\left(O\left(s_{i}^{\prime}, s_{-i}\right)\right)$
for each $i$ and each $s_{i}^{\prime}$ .

无效威胁，不可置信威胁

动态博弈：子博弈精炼纳什均衡
$\begin{aligned} \max & q_{1}\left(1-q_{1}-\frac{1-q_1}{2}\right) \\ &\left\{\begin{array}{l} s_{1}^{*}=\frac{1}{2} \\ s_{2}^{*}=\frac{1-q_{1}}{2} \end{array}\right. \end{aligned}$
注意这个 $s_2^*$

子博弈精炼纳什均衡

$s$ is a subgame perfect Nash equilibrium if
$u_{i}\left(O_{h}(s)\right) \geq u_{i}\left(O_{h}\left(s_{i}^{\prime}, s_{-i}\right)\right)$
for each $i$ and each $s_{i}^{\prime}$ and each $\ N h \in T \backslash N$ .

完全信息动态博弈描述

Players: $I=\{1,2, \ldots, n\}$
Tree $T_{h}:=\left\{h^{\prime} \mid\left(h, h^{\prime}\right) \in T\right\}$
Terminal histories $N_{h}:=\left\{h^{\prime} \mid\left(h, h^{\prime}\right) \in N\right\}$ ,
Player function $P_{h}\left(h^{\prime}\right):=P\left(h, h^{\prime}\right)$ ,
Payoff function $u_{h, i}\left(h^{\prime}\right):=u_{i}\left(h, h^{\prime}\right)$ .
Induced strategy: $s_{h, i}\left(h^{\prime}\right):=s_{i}\left(h, h^{\prime}\right)$ .

backward induction：后退归纳法

无穷期博弈表示：

Let $A=\{(C, C),(C, D),(D, C),(D, D)\}$ .

$T=\{\emptyset\} \cup A \cup A^{2} \cup \cdots \cup A^{\infty} .$
$N=A^{\infty} .$
$P(h)=\{1,2\}$ for all $\in T / N .$

Let
$\begin{aligned} r_{1}(C, C) &=10, r_{1}(C, D)=0 \\ r_{1}(D, C) &=15, r_{1}(D, D)=5 \end{aligned}$
Then
$u_{1}\left(a^{1}, a^{2}, \ldots\right)=r_{1}\left(a^{1}\right)+\delta r_{1}\left(a^{2}\right)+\delta^{2} r_{1}\left(a^{3}\right)+\cdots .$

长期关系

Tit or tat ?

以牙还牙

Grim Trigger

冷酷策略

严格报复策略是纳什均衡，子博弈精炼纳什均衡

当历史有D无D，都为纳什均衡

取决于贴现 $KaTeX parse error: Undefined control sequence: \var at position 1: \̲v̲a̲r̲$ 和明天还会玩的概率

参与人变化比如家族或者惩罚一村的人信息传递

不完全信息动态博弈

信息不对称

炸金花博弈描述

Two players: 1 and 2 .
Game tree: $T=\{\emptyset,(F),(R),(R, F),(R, C)\}$ .
Player function: $P(\emptyset)=1, P((R))=2$ .
Uncertainty: $\Theta=\Theta_{1}=\{$ Ace, King $\}$ ;
$\operatorname{Pr}(\theta=$ Ace $) = 0.5$ .
Payoff: $u_{1}((F), \theta)=-1 ; u_{1}((R, F), \theta)=1, \ldots$

不完全信息博弈策略： 在每个可能做决策的地方对每个可能的你做一个决策行动

不完全信息是对方，别把自己给绕晕了！！！！

Given $\left(\sigma_{1}, \sigma_{2}, b\right):$
$\begin{aligned} E\left[u_{1}\left(m_{1}, \sigma_{2}, \theta\right)\right] &= u_{1}\left(m_{1}, a_{1}, \theta\right) \sigma_{2}+u_{1}\left(m_{1}, a_{2}, \theta\right)\left(1-\sigma_{2}\right) \end{aligned}$
$\begin{aligned} &E\left[u_{2}\left(m_{1}, a, \theta\right) \mid b\right]= u_{2}\left(m_{1}, a, t_{1}\right) b+u_{2}\left(m_{1}, a, t_{2}\right)(1-b) \end{aligned}$

贝叶斯公式
$b=\frac{\sigma_{1}\left(t_{1}\right) \gamma}{\sigma_{1}\left(t_{1}\right) \gamma+\sigma_{1}\left(t_{2}\right)(1-\gamma)}$
Expected payoff:
$E\left[u_{i}\left(a_{i}, s_{j}\left(\theta_{j}\right), \theta_{i}, \theta_{j}\right)\right]=\sum_{\theta_{j} \in \Theta_{j}} u_{i}\left(a_{i}, s_{j}\left(\theta_{j}\right), \theta_{i}, \theta_{j}\right) f_{j}\left(\theta_{j}\right)$
Expected payoff:
$E\left[u_{i}\left(a_{i}, s_{j}\left(\theta_{j}\right), \theta\right)\right]=\int_{\theta_{j} \in \Theta_{j}} u_{i}\left(a_{i}, s_{j}\left(\theta_{j}\right), \theta\right) f_{j}\left(\theta_{j}\right) \mathrm{d} \theta_{\mathrm{j}}$
$s=\left(s_{1}, s_{2}\right)$ is a Bayesian equilibrium if
$E\left[u_{i}\left(s_{i}\left(\theta_{i}\right), s_{j}\left(\theta_{j}\right), \theta\right)\right] \geq E\left[u_{i}\left(a_{i}, s_{j}\left(\theta_{j}\right), \theta\right)\right]$
for each $a_{i}$ , each $\theta_{i}$ , and each $i$ .

$s_{i}$ is a dominant strategy if
$E\left[u_{i}\left(s_{i}\left(\theta_{i}\right), s_{j}\left(\theta_{j}\right), \theta\right)\right] \geq E\left[u_{i}\left(a_{i}, s_{j}\left(\theta_{j}\right), \theta\right)\right],$
for each $a_{i}$ , each $\theta_{i}$ , and each $s_{j}$ .

贝叶斯均衡

Perfect Bayesian equilibrium Defifinition

$\left(\sigma_{1}, \sigma_{2}, b\right)$ is a perfect Bayesian equilibrium if:

if $\sigma_{1}(\theta)>0$ , then
$E\left[u_{1}\left(m_{1}, \sigma_{2}, \theta\right)\right] \geq u_{1}\left(m_{2}, \theta\right) ;$
if $\sigma_{1}(\theta)<1$ , then
$E\left[u_{1}\left(m_{1}, \sigma_{2}, \theta\right)\right] \leq u_{1}\left(m_{2}, \theta\right) ;$
if $\sigma_{2}>0$ , then
$E\left[u_{2}\left(m_{1}, a_{1}, \theta\right) \mid b\right] \geq E\left[u_{2}\left(m_{1}, a_{2}, \theta\right) \mid b\right] ;$
if $\sigma_{2}<1$ , then
$E\left[u_{2}\left(m_{1}, a_{1}, \theta\right) \mid b\right] \leq E\left[u_{2}\left(m_{1}, a_{2}, \theta\right) \mid b\right] ;$
if $\sigma_{1}\left(t_{1}\right)>0$ or $\sigma_{1}\left(t_{2}\right)>0$ , then

$b=\frac{\sigma_{1}\left(t_{1}\right) \gamma}{\sigma_{1}\left(t_{1}\right) \gamma+\sigma_{1}\left(t_{2}\right)(1-\gamma)} .$

拍卖理论

Auctions

第二价格拍卖

价高者付第二高的价格

第一价格拍卖

价高者付第一高的价格

Players: buyers 1 and $2 .$
Action=bid: $b_{i} \in[0, \infty)$ .
Uncertainty: $\Theta_{1}=\Theta_{2}=[0,1] ; v_{i} \sim U[0,1]$ .
Payoff: $u_{i}\left(b_{i}, b_{j}, v_{i}\right)= \begin{cases}v_{i}-b_{i}, & \text { if } b_{i}>b_{j} ; \\ \frac{1}{2}\left(v_{i}-b_{i}\right), & \text { if } b_{i}=b_{j} ; \\ 0, & \text { if } b_{i}<b_{j}\end{cases}$

Second-price auction:
$\int_{0}^{1} \int_{0}^{1} \min \left\{v_{1}, v_{2}\right\} \mathrm{d} v_{1} \mathrm{~d} v_{2}=\frac{1}{3} .$
First-price auction:
$\int_{0}^{1} \int_{0}^{1} \max \left\{\frac{v_{1}}{2}, \frac{v_{2}}{2}\right\} \mathrm{d} v_{1} \mathrm{~d} v_{2}=\frac{1}{3} .$

signaling

说真话要付出代价才会让人相信

分离均衡(Separating equilibrium)

可以完全分清楚类型

混同均衡(Pooling equilibrium)

没有信息的更新

半分离均衡(Semieparating equilibrium)

有一定的信息更新，可以分清楚一部分

有无信息的更新

完美贝叶斯博弈均衡时一个解概念

混同、分离、办分离均衡都属于完美贝叶斯博弈均衡的一种

总结：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-gfiKtY5F-1641462637615)(https://gitee.com/zhang-yixin/markdown-drawing-bed/raw/master/img//202201041219492.png)]