【贡献(权重)分配】Shapley Value 夏普利值的理解以及实例说明

一、简介

夏普利值博弈论理论中的一个概念,由劳埃德-夏普利在1951年提出了这个概念,并因此在2012年获得了诺贝尔经济学奖。对于每个合作博弈,它为所有玩家的联盟产生的总盈余分配了一个独特的分配。

二、夏普利值的理解

夏普利值是一种公平分配成员贡献的方法,通过对所有可能的联盟进行考虑,计算每个成员在合作中的边际贡献,并根据权重因子进行加权求和。

夏普利值的步骤如下:

  1. 考虑所有可能的联盟:Shapley Value考虑了合作中的所有可能联盟。联盟是指合作成员的不同组合方式,包括包含不同成员的子集。
  2. 边际贡献的计算:对于每个成员i,Shapley Value计算成员i在联盟中的边际贡献。边际贡献表示成员i的加入对于联盟的整体贡献增量。
  3. 加权求和:使用权重因子对每个成员的边际贡献进行加权求和。权重因子考虑了联盟规模的不同可能性,以确保公平性和合理性。
  4. 结果解释:Shapley Value的计算结果表示每个成员在合作中的贡献度。较高的Shapley Value意味着成员对于整体合作的贡献较大。
    小结
    通过夏普利值的计算,可以公平地分配成员的贡献,并提供一个理性的评估方法。它避免了简单地将整体成果均分给每个成员,而是根据每个成员的边际贡献进行分配。这种方法能够促进公正和合作,并鼓励成员在合作中发挥积极作用。

三、相关数学的理论

1. 夏普利值(Shapley Value)计算公式

V ( i ) = ∑ S ⊆ N ∖ { i } ( ∣ S ∣ ! ( ∣ N ∣ − ∣ S ∣ − 1 ) ! ) ∣ N ∣ ! ( v ( S ∪ { i } ) − v ( S ) ) V(i) = \sum_{S \subseteq N \setminus \{i\}} \frac{{(|S|!(|N|-|S|-1)!)}}{{|N|!}} (v(S \cup \{i\}) - v(S)) V(i)=SN{i}N!(S!(NS1)!)(v(S{i})v(S))

其中
V ( i ) V(i) V(i) : 表示参与者 i i i 的夏普利值;
N N N : 表示参与者的集合;
∣ N ∣ |N| N : 表示参与者的集合元素个数;
S S S : 是 N N N 的子集;
∣ S ∣ |S| S : 是 N N N 的子集个数;
v ( S ) v(S) v(S) 表示合作组合 S S S 的价值(例如,利润)

在夏普利值的计算中,我们对所有可能的合作组合 S S S 进行遍历,并计算参与者 i i i 加入组合 S S S 后的新增贡献,即 v ( S ∪ i ) − v ( S ) v(S \cup {i}) - v(S) v(Si)v(S)。然后,我们对所有组合的新增贡献进行加权平均,其中权重根据组合的大小来确定。

这个公式的含义是,夏普利值等于参与者在所有可能的合作组合中所做的平均贡献。它考虑了每个参与者的边际贡献,并通过加权平均来确定最终的分配。

请注意,这个公式适用于合作博弈的情况,其中参与者之间可以合作形成不同的组合,并获得相应的价值。在具体的问题中,需要根据具体的合作情况和价值设定来确定合适的数值进行计算。

2.第i个成员的夏普利计算公式

当成员 i 的夏普利值计算公式为:

φ i ( υ ) = ∑ s ∈ S i ω ( ∣ s ∣ ) [ υ ( s ) − υ ( s ∖ { i } ) ] \varphi_i(\upsilon) = \sum_{s \in S_i} \omega(|s|) [\upsilon(s) - \upsilon(s \setminus \{i\})] φi(υ)=sSiω(s)[υ(s)υ(s{i})]

其中,加权因子表示不同联盟规模下的可能性,具体计算公式为:
ω ( ∣ s ∣ ) = ( ∣ s ∣ − 1 ) ! ( n − ∣ s ∣ ) ! n ! \omega(|s|) = \frac{(|s|-1)! (n-|s|)!}{n!} ω(s)=n!(s1)!(ns)!

其中:
φ i ( υ ) \varphi_i(\upsilon) φi(υ) : 表示成员 i {i } i的夏普利值,即成员 i {i } i的贡献度。
S i {S_i } Si : 是包含成员 i i i的所有子集形成的集合。
∣ s ∣ {|s|} s : 表示集合 s {s} s中元素的个数。
ω ( ∣ s ∣ ) \omega(|s|) ω(s) : 是加权因子,即权重,计算公式为 ω ( ∣ s ∣ ) = ( ∣ s ∣ − 1 ) ! ( n − ∣ s ∣ ) ! n ! \omega(|s|) = \frac{(|s|-1)! (n-|s|)!}{n!} ω(s)=n!(s1)!(ns)!,考虑了不同联盟规模下的可能性。
s ∖ i s \setminus {i} si : 表示集合 i {i } i 中去掉成员 i i i后的集合。
υ ( s ) \upsilon(s) υ(s) : 表示联盟 s s s的获利。
υ ( s ∖ i ) \upsilon(s \setminus {i}) υ(si) : 表示联盟 s {s} s 去掉成员 i i i后的获利。
υ ( s ) − υ ( s ∖ i ) \upsilon(s) - \upsilon(s \setminus {i}) υ(s)υ(si) : 表示成员 i i i在联盟中的边际贡献,即成员 i i i的边际获利
∣ s ∣ |s| s表示集合 s s s 的元素个数,
n n n 表示合作人的总数。

疑问1: ( ∣ S ∣ ! ( ∣ N ∣ − ∣ S ∣ − 1 ) ! ) ∣ N ∣ ! \frac{{(|S|!(|N|-|S|-1)!)}}{{|N|!}} N!(S!(NS1)!) ( ∣ s ∣ − 1 ) ! ( n − ∣ s ∣ ) ! n ! \frac{(|s|-1)! (n-|s|)!}{n!} n!(s1)!(ns)!相等吗?

等价的,

∣ S ∣ |S| S 是集合 S S S 的元素数量;
∣ N ∣ |N| N 是集合 N N N 的元素数量;
n n n 是总的元素数量。
这两个公式都是用来计算集合 S S S 在集合 N N N 中的组合数量的。

公式 ( ∣ S ∣ ! ( ∣ N ∣ − ∣ S ∣ − 1 ) ! ) ∣ N ∣ ! \frac{{(|S|!(|N|-|S|-1)!)}}{{|N|!}} N!(S!(NS1)!) 表示在集合 N N N 中,选择 ∣ S ∣ |S| S 个元素的组合数量。其中, ∣ S ∣ ! ( ∣ N ∣ − ∣ S ∣ − 1 ) ! |S|!(|N|-|S|-1)! S!(NS1)! 表示选择 ∣ S ∣ |S| S 个元素的排列数量,再除以 ∣ N ∣ ! |N|! N! 得到组合数量。

公式 ( ∣ s ∣ − 1 ) ! ( n − ∣ s ∣ ) ! n ! \frac{{(|s|-1)! (n-|s|)!}}{{n!}} n!(s1)!(ns)! 也表示在总共 n n n 个元素中,选择 ∣ s ∣ |s| s 个元素的组合数量。其中, ( ∣ s ∣ − 1 ) ! ( n − ∣ s ∣ ) ! (|s|-1)! (n-|s|)! (s1)!(ns)! 表示选择 ∣ s ∣ |s| s 个元素的排列数量,再除以 n ! n! n! 得到组合数量。

因此,这两个公式在计算集合组合数量时是等价的。

四、 例子

  • 背景:
    甲、乙、丙三人合作经商。倘若甲、乙合作可获利7万元,甲、丙合作可获利5万元,乙、丙合作可获利4万元,三人合作则获利11万元,每人单干各获利1万元[^1]。

  • 研究目的:问三人合作时,如何分配获利?

  • 问题拆解:
    – 甲、乙合作获利为7万元。
    – 甲、丙合作获利为5万元。
    – 乙、丙合作获利为4万元。
    – 三人合作获利为11万元。
    – 每人单干获利为1万元。

现在我们来计算每个成员的夏普利值:

· 对于 φ ( i = 甲 ) \varphi_{(i=甲)} φ(i=)
只有甲参与合作:贡献为 1 万元
只有甲、乙参与合作:贡献为 7 - 1 = 6 万元
只有甲、丙参与合作:贡献为 5 - 1 = 4 万元
甲、乙、丙三人合作:贡献为 11 - 4 = 7 万元

包含联盟{甲}{甲,乙}{甲,丙}(甲,乙,丙)
υ ( 甲 ) \upsilon({甲}) υ(): 联盟的收益(万元)17511
υ ( s ∖ { i } ) \upsilon(s \setminus \{i\}) υ(s{i}): 剔除甲后联盟的收益 (万元)0114
υ ( s ) − υ ( s ∖ { i } ) \upsilon(s) - \upsilon(s \setminus \{i\}) υ(s)υ(s{i}): 甲的边际贡献 (万元)1647
∣ s ∣ |s| s :联盟的成员个数1223
ω ( ∣ s ∣ ) \omega(|s|) ω(s) : 权重系数 ( ∣ s ∣ − 1 ) ! ( n − ∣ s ∣ ) ! n ! \frac{(|s|-1)! (n-|s|)!}{n!} n!(s1)!(ns)!0!2!/3!=2/61!1!/3!=1/61!1!/3!=1/62!0!/3!=2/6
ω ( ∣ s ∣ ) [ υ ( s ) − υ ( s ∖ { i } ) ] \omega(|s|) [\upsilon(s) - \upsilon(s \setminus \{i\})] ω(s)[υ(s)υ(s{i})]0.33=1*2/61=6*1/60.67=4*1/62.33=7*2/6

甲所有可能的联盟中的边际贡献为:
φ ( i = 甲 ) \varphi_{(i=甲)} φ(i=) = 0.33+1+0.67+2.33 = 4.33

  • 对于 φ ( i = 乙 ) \varphi_{(i=乙)} φ(i=)
    只有乙参与合作:贡献为 1 万元
    只有甲、乙参与合作:贡献为 7 - 1 = 6万元
    只有乙、丙参与合作:贡献为 4 - 1 = 3万元
    甲、乙、丙三人合作:贡献为 11 - 5 = 6万元
包含联盟{乙}{甲,乙}{乙,丙}(甲,乙,丙)
υ ( 乙 ) \upsilon({乙}) υ(): 联盟的收益(万元)17411
υ ( s ∖ { i } ) \upsilon(s \setminus \{i\}) υ(s{i}): 剔除乙后联盟的收益 (万元)0115
υ ( s ) − υ ( s ∖ { i } ) \upsilon(s) - \upsilon(s \setminus \{i\}) υ(s)υ(s{i}): 乙的边际贡献 (万元)1636
∣ s ∣ |s| s :联盟的成员个数1223
ω ( ∣ s ∣ ) \omega(|s|) ω(s) : 权重系数 ( ∣ s ∣ − 1 ) ! ( n − ∣ s ∣ ) ! n ! \frac{(|s|-1)! (n-|s|)!}{n!} n!(s1)!(ns)!0!2!/3!=2/61!1!/3!=1/61!1!/3!=1/62!0!/3!=2/6
ω ( ∣ s ∣ ) [ υ ( s ) − υ ( s ∖ { i } ) ] \omega(|s|) [\upsilon(s) - \upsilon(s \setminus \{i\})] ω(s)[υ(s)υ(s{i})]0.33=1*2/61=6*1/60.50=4*1/62=6*2/6

乙在所有可能的联盟中的边际贡献为:
φ ( i = 乙 ) \varphi_{(i=乙)} φ(i=) = 0.33+1+0.50+2.00 = 3.83

  • 对于 φ ( i = 丙 ) \varphi_{(i=丙)} φ(i=):

只有丙参与合作:贡献为 1万元
只有甲、丙参与合作:贡献为 5 - 1 = 4万元
只有乙、丙参与合作:贡献为 4 - 1 = 3万元
甲、乙、丙三人合作:贡献为 11 - 7= 4万元

包含联盟{丙}{甲,丙}{乙,丙}(甲,乙,丙)
υ ( 丙 ) \upsilon({丙}) υ(): 联盟的收益(万元)15411
υ ( s ∖ { i } ) \upsilon(s \setminus \{i\}) υ(s{i}): 剔除丙后联盟的收益 (万元)0117
υ ( s ) − υ ( s ∖ { i } ) \upsilon(s) - \upsilon(s \setminus \{i\}) υ(s)υ(s{i}): 丙的边际贡献 (万元)1434
∣ s ∣ |s| s :联盟的成员个数1223
ω ( ∣ s ∣ ) ) \omega(|s|)) ω(s)) : 权重系数 ( ∣ s ∣ ) − 1 ) ! ( n − ∣ s ∣ ) ) ! n ! \frac{(|s|)-1)! (n-|s|))!}{n!} n!(s)1)!(ns))!0!2!/3!=2/61!1!/3!=1/61!1!/3!=1/62!0!/3!=2/6
ω ( ∣ s ∣ ) [ υ ( s ) − υ ( s ∖ { i } ) ] \omega(|s|) [\upsilon(s) - \upsilon(s \setminus \{i\})] ω(s)[υ(s)υ(s{i})]0.33=1*2/60.67=6*1/60.50=4*1/61.33=4*2/6

丙在所有可能的联盟中的边际贡献为:
φ ( i = 丙 ) \varphi_{(i=丙)} φ(i=) = 0.33+0.67+0.50+1.33 = 2.84

当甲、乙、丙合作时,每个应分得4.33万、3.83万、2.83万;

[^1]:关于Shapley Value(夏普利值)的公式

  • 12
    点赞
  • 70
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值