读书笔记: 博弈论导论 - 03 - 完整信息的静态博弈 预备知识

读书笔记: 博弈论导论 - 03 - 完整信息的静态博弈 预备知识

预备知识

本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。

知识点

  • 静态完全信息博弈(static games of complete information)
    第一步:每个玩家同时并且独立的选择一个行动,(每个玩家都不知道别人的选择情况)
    第二步:根据所有玩家选择的行动,收益被分布到每个玩家。

  • 完全信息博弈(Games of Complete Information)
    一个完全信息博弈要求:下面四部分是博弈中所有玩家的公共知识。
    1. 所有玩家的所有可能的行动
    2. 所有可能的结果
    3. 所有玩家的各种行动组合产生什么样的结果
    4. 每个玩家对结果的倾向
  • 公共知识(common knowledge)
    一个公共知识是一个事件E,并且 (1) 每个人都知道, (2) 每个人都知道每个人都知道,像这样无限循环下去。

普通形式博弈

  • 普通形式博弈(normal-form game)有下面三个特征:
    1. 一组玩家
    2. 每个玩家有一套行动
    3. 一套收益函数:每个玩家的行动组合都有一个收益值。
  • 策略(strategy)
    打算完成一个特定目标的行动计划。

  • 纯策略(pure strategy)
    玩家i的一个纯策略是一个确定性的(意味着没有随机性)行动计划。
    \(S_i\)用来表示玩家i的所有纯策略。

  • 所有玩家的纯策略组合(a profile of pure strategies)
    \(s = (s_i, s_2, \cdots, s_n), s_i \in S_i \text{ for all } i = 1,2,\cdots, n\)
    代表在一个博弈中所有n的玩家的一组选择的纯策略组合。

  • 普通形式博弈(normal-form game)的数学表达
    1. 一个有限的玩家集合, \(N = {1, 2, \cdots, n}\)
    2. 每个玩家的纯策略集合的组合, \({S_1, S_2, \cdots, S_n}\)
    3. 一套收益函数, \({v_1, v_2, \cdots, v_n}\),对于每个玩家,每一种所有玩家选择的策略组合,都有一个收益值。
      $v_i: S_1 \times S_2 \times \cdots \times S_n \text{ for each } i \in N $
  • 普通形式博弈(normal-form game)的数学表达例子:囚徒困境(The Prisoner's Dilemma)

    Players:\(N = {1,2}\)
    Strategy sets: \(S_i = {M, F} \ for \ i \in N\)
    Payoffs: Let \(v_i(s_1, s_2)\) be the payoff to player i if player 1 choose \(s_1\) and player 2 chooses \(s_2\)
    We can then write payoff are
    \(v_1(M, M) = v_2(M, M) = -2\)
    \(v_1(F, F) = v_2(F, F) = -4\)
    \(v_1(F, M) = v_2(F, M) = -5\)
    \(v_1(M, F) = v_2(M, F) = -1\)
    M: mum 沉默; F:fink 告密

2人有限博弈的矩阵表达

  • 例子:囚徒困境(The Prisoner's Dilemma)
Player 2
MF
Player 1M-2, -2-5, -1
F-1, -5-4, -4

方案设想(solution concept)

  • 方案设想(solution concept)
    方案设想(solution concept)是一个分析博弈的方法,用于限定出所有可能的合理结果。
    一个方案设想将导致一个预言或者处方。

  • 均衡(equilibrium)
    任何一种可以产生方案设想预言的策略组合。
    也就是可以任何一种导致合理结果的策略组合。

如果用因果关系来说明,均衡是(可以导致合理结果的)因,方案设想是(可以导致合理结果的)分析方法,因果关系的公共知识。
从权衡方面来说:方案设想就是一个权衡。均衡的权衡的结果。

  • 方案设想的假设条件
    1. 玩家是理性的
    2. 玩家是智力的
    3. 公共知识:“玩家是理性的”和“玩家是智力的”是所有玩家的公共知识。
    4. 自我执行:方案设想的均衡必须是自我执行的。(每个玩家都会采用一种均衡结果)
  • 方案设想的评估
    1. 存在性(Existence: How often does it apply?)
    2. 唯一性(Uniqueness: How much does it restrict behavior?)
    3. 不变性(Invariance: How sensitive is it to small changes?)
  • 帕累托优势(pareto dominate)
    策略组合s帕累托优势于策略组合s',其前提条件:对于每个玩家,在策略组合s中的收益都大于等于在策略组合s‘中的收益,并且至少有一个玩家,在策略组合s中的收益大于在策略组合s‘中的收益。

\[ v_i(s) \geq v_i(s'), \forall i \in N \\ \ v_i(s) > v_i(s'), \exists i \in N \]

参照

转载于:https://www.cnblogs.com/steven-yang/p/8075913.html

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值