【博弈论5——合作博弈】

最新推荐文章于 2025-03-31 16:01:37 发布

我就是菜鸡1229

最新推荐文章于 2025-03-31 16:01:37 发布

阅读量4.8k

点赞数 27

文章标签：博弈论合作博弈

本文链接：https://blog.csdn.net/qq_45467608/article/details/137208017

版权

1.帕累托最优

帕累托最优（Pareto Optimality）是经济学和决策理论中非常重要的一个概念，它描述了一种资源配置的状态，在这种状态下，任何改变都不可能使一部分人的境况变好而不使另一部分人的境况变差，即不存在所谓的帕累托改进（Pareto Improvement）。换句话说，如果一个经济体或者社会达到了帕累托最优，那么已经没有进一步调整资源配置的方式可以使得至少一个人受益而没有任何其他人受损。

2.合作博弈与数学表示

2.1 n人博弈的函数式

在多人合作博弈中，联盟是一个非常重要的概念。
在n人博弈中，参与人的集合用 $I=\{1,2,...,n\}$ 表示， $I$ 的任意子集 $S$ 称为一个联盟。
下面给出n人博弈的特征函数式：
设有n个参与人的集合 $I=\{1,2,...,n\}$ ,对任一子集 $\subseteq I$ ,定义一个实函数 $V (S)$ 满足条件：
（1） $V(\phi)=0$ ， $\phi$ 表示空集
（2）当 $S_1\cup S_2=\phi$ ， $S_1\subset I$ , $S_2\subset I$ 时, $V(S_1 \cup S_2)\ge V(S_1)+V(S_2)$ ,称为超可加性，在经济学上称之为协同效应

我们把 $[I, V]$ 称为一个n人合作博弈，称 $V (S)$ 为这个n人合作博弈的特征函数，其中S是I的任意子集（联盟）， $V (S)$ 描述了联盟的效益。
特征函数式对n人合作博弈的每一种可能联盟都给出了对应的联盟收益，也就是给出了一种集合函数。

2.2 n人博弈中合作的方式

第一个情况：参与博弈的n个人形成一个合作联盟，称此联盟对应的博弈为n人大联盟合作博弈。n人大联盟合作博弈的解是指对大结盟所获利益 $V (I)$ 的一个分配方案。
若用 $\varphi_i(V(I)),i\in I$ 表示参与人i从n人大联盟合作博弈中获得的收益，则 $\varphi_i(V(I))$ 至少应满足：
（1）个体合理性： $KaTeX parse error: Undefined control sequence: \geV at position 16: \varphi_i(V(I))\̲g̲e̲V̲({i}),i\in I$ ，即合作至少不比单干差。
（2）总体合理性： $\sum_{i\in I}(V(I))=V(I)$ ,即将合作博弈 $[I, V]$ 中获得的收益 $V (I)$ 分光。
因此解决n人合作博弈问题的任务是如何获得一个合理的分配方案:
$\phi(V(I))=(\varphi_1(V(I)),\varphi_2(V(I)),...,\varphi_n(V(I)))$

第二种情形是：在参与人多余两个的情况下，就可能出现部分参与者联合起来追求小团体利益的行为，但其前提条件是参与者在小团体中得到的利益大或等于在大联盟中得到的利益，即存在子集 $S={i_1,i_2,...,i_k}\subset I$ ，相应的总收益为 $V (S)$ ，分配方案：
$\phi(V(S))=(\varphi_1(V(S)),\varphi_2(V(S)),...,\varphi_n(V(S)))$
满足,且其中至少有一个严格不等式成立。
$\varphi_{i_1}(V(S))\ge\varphi_{i_1}(V(I)) \\ \varphi_{i_2}(V(S))\ge\varphi_{i_2}(V(I)) \\ ...... \\ \varphi_{i_k}(V(S))\ge\varphi_{i_k}(V(I)) \\$

3.大联盟合作博弈中的效益分配——Shapley值计算

详见我的另外一篇博客：Shapley值的计算

4.大联盟合作博弈中如何量化决策影响力——班扎夫权利指数

班扎夫权利指数（Banzhaf Power Index, Banzhaf Power Measure），是由约翰·F·班扎夫三世（John F. Banzhaf III）在20世纪60年代提出的，它是量化投票系统中个体或团体决策影响力的指标，广泛应用于社会选择理论和政治科学中，尤其是在分析不同投票成员在集体决策中的相对权力。

在一个投票体系统中，比如使用多数规则（简单多数或特定比例多数）来决定议案是否通过的情况下，班扎夫权力指数衡量的是一个投票者可以通过改变自己的投票从导致议案不通过转变为通过的情况次数，或者是反过来，原本议案会通过但因其反对而无法通过的情况次数。

具体计算方法通常是通过穷举所有可能的投票组合，并统计每个投票者作为“关键票”的情况数量。关键票指的是如果该投票者改变其投票立场，则会导致投票结果发生改变的那张票。

5.其他联盟结构的求解方案

如何寻找联盟的稳定结构——核

在这里插入图片描述

在这里插入图片描述
解释：
在存在旁支付的情况下，2号联盟是合作博弈的核。
在不存在旁支付的情况下，1,2都是合作博弈的核。

核的定义

使得所有参与博弈的人员中的任何成员都不能从联盟重组中获益的结构，称为该合作博弈的核。

如果博弈的有效解集非空且有核，核一定包含在有效解集中。
有效解集中的许多解不是核。
- 符合帕累托标准的联盟结构称为合作博弈的的有效解
- 所有有效解的集合称为博弈的解集
合作博弈的核可以有多个
核概念的致命缺点：经常为空

弱占优和强占优

在博弈论中，“弱占优”和“强占优”这两个概念通常出现在非合作博弈的情境下，而非合作博弈与合作博弈有所不同，但在讨论策略选择最优性时，它们的概念同样适用。
弱占优策略（Weak Dominance）：弱占优策略是指在一个玩家的所有可行策略中，某个策略相对于其他玩家的所有策略而言，无论对方如何选择，其期望收益都不低于任何其他策略，但允许等于某些策略的期望收益。换言之，即使在不确定对手会采取何种策略时，采用弱占优策略也不会让自己处于劣势地位。例如，如果策略A相较于策略B，对于所有对手可能的策略，A的收益都至少不会更差，那么策略A就被称为对策略B的弱占优策略。
强占优策略（Strong Dominance）：强占优策略则更为严格，指的是在一个玩家的所有可行策略中，某个策略相对于其他玩家的所有策略而言，其期望收益始终高于所有其他策略，而不只是不低于。也就是说，不论对手怎么行动，选择强占优策略总会带来更好的结果。比如，若策略A对于所有对手可能的策略，其收益总是优于或至少等于策略B，并且存在至少一种对手策略使得A的收益更好，那么策略A就对策略B实现了强占优。