【博弈论3——二人博弈的纳什均衡】

1.俾斯麦海之战

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2. 零和博弈的定义

零和博弈(Zero-Sum Game)是一种博弈论的基本概念,指的是在博弈过程中,博弈参与者之间的收益和损失之和总是一个常数,特别是总和为零。即博弈一方的收益必然等于另一方的损失,不存在共赢或多赢的情况。换句话说,在零和博弈中,博弈双方的利益是对立的,博弈的结果是一方得利必定伴随着另一方的损失,整个博弈的总体价值是恒定不变的。
在这里插入图片描述

3. 纯策略纳什均衡

假设零和博弈 G = { S 1 , S 2 ; A } G=\{S_1,S_2;A\} G={S1,S2;A},其中 S 1 = { A 1 , A 2 . A 3 } S_1=\{A_1,A_2.A_3\} S1={A1,A2.A3}, S 2 = { B 1 , B 2 . B 3 } S_2=\{B_1,B_2.B_3\} S2={B1,B2.B3},
A = [ 6 − 1 0 3 1 2 − 3 0 − 1 ] A=\begin{bmatrix} 6 & -1 & 0 \\ 3 & 1 & 2 \\ -3 & 0 & -1 \end{bmatrix} A= 633110021
各局中人应如何选择自己的策略,保证自己在博弈中取得有利的地位。
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

4.博弈论中的最小最大定理

在这里插入图片描述
对于任意一个两个玩家A和B之间的完全信息、零和、有限策略集的博弈,存在一个数V和玩家A的一个策略σ*,使得无论对手B采取何种策略,通过执行σ*,A所能获得的最小收益至少是V。同时,存在玩家B的一个策略τ*,使得当B执行τ*时,即使面对A的最优策略,其给A带来的最大损失也不超过V。

换句话说,A的最小期望得益(即最大损失)等于B的最大期望损失(即最小得益),这个相同的数值就是游戏的值V。A的最优策略是在所有可能的策略中找到那个能够抵御对手任何反击的策略,以确保最坏情况下的最好结果;而B则反过来尝试最大化A的最坏结果,即最小化自己的最大损失。

博弈在纯策略意义下的纳什均衡可以不唯一,博弈的值是唯一的。

5. 混合策略纳什均衡

假设零和博弈 G = { S 1 , S 2 ; A } G=\{S_1,S_2;A\} G={S1,S2;A},
其中 S 1 = { A 1 , A 2 , . . . A m } S_1=\{A_1,A_2,...A_m\} S1={A1,A2,...Am},选择每个策略的概率为 X = { x 1 , x 2 , . . . , x m } X=\{x_1,x_2,...,x_m\} X={x1,x2,...,xm};
S 2 = { B 1 , B 2 , . . . , B n } S_2=\{B_1,B_2,...,B_n\} S2={B1,B2,...,Bn},选择每个策略的概率为 Y = { y 1 , y 2 , . . . , y n } Y=\{y_1,y_2,...,y_n\} Y={y1,y2,...,yn}
A = ( a i j ) m × n A=(a_{ij})_{m\times n} A=(aij)m×n
在这里插入图片描述
对于给定的博弈G,
局中人1的所有混合策略构成的集合 S 1 ∗ = { X } S_1^*=\{X\} S1={X}
局中人2的所有混合策略构成的集合 S 2 ∗ = { Y } S_2^*=\{Y\} S2={Y}
期望为 G ∗ = { S 1 ∗ , S 2 ∗ ; E } G^*=\{S_1^*,S_2^*;E\} G={S1,S2;E},为博弈G的混合扩充。

目标
在这里插入图片描述
任何一个给定的二人零和博弈G一定存在混合策略意义下的纳什均衡

6.一个例子

在这里插入图片描述

7.非零和博弈的定义

  • 各方的收益或损失的总和不是零值。
  • 局中人之间不再是完全对立
  • 一个局中人的所得并不一定意味着其他局中人要同样数量的损失
  • 博弈参与方之间可能存在某种共同利益,可以“双赢”或“多赢”

7.1 求解二人非零和博弈混合策略纳什均衡的一般方法

在这里插入图片描述

7.2 反复剔除严格劣策略

在“局中人是理性的”假设前提下,如果一个人的策略集合中存在严格劣策略,理性的他永远不会选择严格劣策略。反复剔除严格劣策略适用于零和博弈与非零和博弈。

  1. 对于局中人1的b策略严格劣与策略d,所以策略b可以删除。
    在这里插入图片描述
  2. 最后可以得到
    在这里插入图片描述

8.奇数定理及其应用

奇数定理:几乎所有的有限策略的博弈都有奇数个纳什均衡,包括纯策略纳什均衡混合策略纳什均衡

简单来说,根据奇数定理,如果一个博弈有两个纯策略纳什均衡,则必定存在至少一个额外的纳什均衡,这导致了纳什均衡的总数是奇数。纳什均衡是指在一个博弈中,没有一个参与者可以通过单独改变自己的策略来改善其结果的稳定策略组合。

需要注意的是,“几乎所有的”这一描述表明并非所有博弈都严格遵循这个规律,但大部分有限博弈确实表现出这样的特性。这个定理对于理解和分析博弈论中的复杂交互行为有着重要意义。

  • 29
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
纳什均衡博弈论的一个重要概念,对于多人博弈模型,可以使用Matlab进行计算。下面是一个简单的纳什均衡计算的Matlab代码示例: ```matlab % 定义收益矩阵 payoff_matrix = [2 0; 0 1]; % 定义两名玩家的策略空间和初始策略 strategies = [0 1; 0 1]; player1_strategy = 1; player2_strategy = 1; % 计算每个玩家的收益 player1_payoff = payoff_matrix(player1_strategy, player2_strategy); player2_payoff = payoff_matrix(player2_strategy, player1_strategy); % 迭代计算纳什均衡 for i = 1:100 % 更新玩家1的策略 [~, max_index] = max(payoff_matrix(:, player2_strategy)); player1_strategy = max_index; % 更新玩家2的策略 [~, max_index] = max(payoff_matrix(player1_strategy, :)); player2_strategy = max_index; % 计算每个玩家的收益 player1_payoff = payoff_matrix(player1_strategy, player2_strategy); player2_payoff = payoff_matrix(player2_strategy, player1_strategy); end % 输出纳什均衡策略和收益 fprintf('纳什均衡策略为: (%d,%d)\n', player1_strategy, player2_strategy); fprintf('玩家1的收益为: %d\n', player1_payoff); fprintf('玩家2的收益为: %d\n', player2_payoff); ``` 这个代码示例使用了一个2人博弈的收益矩阵,其中第一行是玩家1的收益,第二行是玩家2的收益。初始化时,玩家1和玩家2的策略都是第一列,即选择第一种策略。然后使用一个简单的迭代算法来计算纳什均衡策略。在每一次迭代中,玩家1会选择收益最大的策略,而玩家2会选择玩家1在当前策略下收益最大的策略。最终,程序输出纳什均衡策略和每个玩家的收益。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值