【公式】博弈论中的核心算法：纳什均衡，纳什均衡就像是一场多人参与的棋局，每个参与者都想要赢得比赛，但是他们都不能只靠改变自己的下棋方式来赢得比赛，因为其他参与者也会根据自己的策略来应对。

认知计算茂森

已于 2024-12-27 18:58:01 修改

阅读量2.3k

点赞数 26

分类专栏：无痛入门人工智能算法博弈论文章标签：人工智能概率论

于 2024-07-25 11:33:29 首次发布

神经美学-茂森

本文链接：https://blog.csdn.net/qq_37148940/article/details/140685297

版权

160 篇文章

订阅专栏

13 篇文章

订阅专栏

博弈论中的核心算法：纳什均衡公式解析

纳什均衡是博弈论中的一个核心概念，它描述了一个博弈中所有参与者都无法通过单方面改变自己的策略来增加收益的状态。在纳什均衡状态下，每个参与者的策略都是对其他参与者策略的最优反应。纳什均衡的公式可以表示为：

$\forall i, \pi_i(s_i^*, s_{-i}^*) \geq \pi_i(s_i, s_{-i}^*)$

其中， $s_i^*$ 表示参与者 $i$ 的最优策略， $s_{-i}^*$ 表示除参与者 $i$ 外其他所有参与者的策略组合， $\pi_i$ 表示参与者 $i$ 的收益函数。

纳什均衡就像是一场多人参与的棋局，每个参与者都想要赢得比赛，但是他们都不能只靠改变自己的下棋方式来赢得比赛，因为其他参与者也会根据自己的策略来应对。具体来说：

项目	描述
最优策略	每个参与者都会选择一个策略，这个策略是对其他参与者策略的最好回应。就像下棋时，你会根据对手的走法来选择你的走法。
无法单方面改变	在纳什均衡状态下，没有一个参与者可以通过单方面改变自己的策略来增加收益。这就像在棋局中，如果你试图改变你的下棋方式，但是其他参与者也会相应地改变他们的策略，所以你并不能因此赢得比赛。
策略组合	纳什均衡考虑的是所有参与者的策略组合，而不仅仅是单个参与者的策略。这就像在棋局中，你需要考虑所有参与者的走法，而不仅仅是你自己的。

在这里插入图片描述

定义策略与收益：
首先，我们定义每个参与者 $i$ 的策略为 $s_i$ ，并定义除参与者 $i$ 外其他所有参与者的策略组合为 $s_{-i}$ 。每个参与者 $i$ 都有一个收益函数 $\pi_i$ ，它表示在给定策略组合下参与者 $i$ 的收益。
最优策略条件：
在纳什均衡状态下，每个参与者 $i$ 的策略 $s_i^*$ 都是对其他参与者策略 $s_{-i}^*$ 的最优反应。这意味着，对于任意其他策略 $s_i$ ，参与者 $i$ 在策略组合 $s_i^*, s_{-i}^*)$ 下的收益都不会小于在策略组合 $s_i, s_{-i}^*)$ 下的收益。
纳什均衡公式：
根据最优策略条件，我们可以得到纳什均衡的公式：
$\forall i, \pi_i(s_i^*, s_{-i}^*) \geq \pi_i(s_i, s_{-i}^*)$
这个公式表示，对于任意参与者 $i$ 和任意其他策略 $s_i$ ，参与者 $i$ 在纳什均衡策略组合下的收益都不会小于在其他策略组合下的收益。