非合作博弈篇——纳什均衡(Nash Equilibrium)

dominating strategies 定义

在这里插入图片描述

strictly dominated 和 weakly dominated 定义

在这里插入图片描述
在这里插入图片描述

dominant-strategy equilibrium 定义

在这里插入图片描述
在这里插入图片描述

举例: iterated dominance 算法

在这里插入图片描述

在这里插入图片描述

适用范围: In iterated strict dominance the order of elimination does not affect the outcome of a game.
In iterated weak dominance, the reduced game could be different depending on the order of elimination of the strategies.Even if no unique outcome can be found through iterated dominance, it can still reduce the strategy space and make it easier to solve the game using other concepts.

Nash Equilibrium 定义

a Nash equilibrium is a state of a non-cooperative game where no player can improve its utility by changing its strategy, if the other players maintain their current strategies.

在这里插入图片描述

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
合作博弈(也称为零和博弈)是指参与者之间的利益冲突,每个参与者的利益损失就是其他参与者的利益收益。 合作博弈可以通过使用不同的算法来解决。其中一个常见的算法是称为Nash Equilibrium纳什均衡)的概念。 纳什均衡是指在博弈过程中,参与者选择自己的行动后,没有任何一个参与者能够通过单方面改变自己的策略来获得更好的收益。也就是说,在纳什均衡状态下,每个参与者都会选择最佳策略,没有人会对此做出改变。 下面是一个简单的合作博弈Nash Equilibrium的算法示例: ``` def find_nash_equilibrium(payoff_matrix): # 获取博弈矩阵的行和列数 rows = len(payoff_matrix) cols = len(payoff_matrix[0]) # 遍历所有玩家的不同策略组合 for i in range(rows): for j in range(cols): payoff = payoff_matrix[i][j] # 判断是否存在更好的策略 better_strategy = True for k in range(rows): if payoff_matrix[k][j] > payoff: better_strategy = False break # 判断是否存在更好的对手策略 if better_strategy: for k in range(cols): if payoff_matrix[i][k] < payoff: better_strategy = False break # 如果不存在更好的策略,则是纳什均衡 if better_strategy: return i, j # 如果没有找到纳什均衡,则返回空值 return None # 使用示例 payoff_matrix = [[3, 2], [1, 4]] nash_equilibrium = find_nash_equilibrium(payoff_matrix) if nash_equilibrium is not None: player1_strategy, player2_strategy = nash_equilibrium print(f"Nash equilibrium: Player 1 chooses strategy {player1_strategy}, Player 2 chooses strategy {player2_strategy}") else: print("No Nash equilibrium exists in the given payoff matrix.") ``` 以上是一个合作博弈的简单示例,该算法可以在给定一个博弈矩阵后找到纳什均衡点。在这个示例中,博弈矩阵是一个2x2的矩阵,其中每个元素表示两个玩家的利益。算法将遍历每个策略组合,并检查是否存在更好的策略或对手策略,如果不存在,则找到了纳什均衡点。如果找到了纳什均衡点,则会输出每个玩家应选择的策略;否则,将输出不存在纳什均衡点。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值