Contest Design with Threshold Objectives 论文阅读笔记
一、基本信息
- 题目:带有门限目标函数的竞赛设计
- 作者:Edith Elkind、Abheek Ghosh、Paul W. Goldberg
二、文章摘要
- 以下内容取自原文摘要部分:
- 我们研究的是一种竞赛,该种竞赛的目标函数是在已经广泛研究的目标函数——最大化输出的基础上拓展的,并且当参赛者的输出水平非常低或者非常高时设计者的边际效用为0。我们考虑两种变体,换言之两种目标函数:二进制门限值(超过门限值对设计者产生1的效用,反之产生0的效用)、线性门限值(在两个门限值之间产生效用与输出成线性关系,其他情况下为常数)。对于这两种目标函数,我们分别研究两种竞赛:rank-order allocation contest(奖项分配只基于参赛者的排名)以及general contest(使用参赛者输出的数字值去分配奖项)。我们分析研究最优化竞赛的性质,并且指出一些有效计算均衡的技巧。我们也证明了在一定情况下,对于线性门限值目标函数,某种ranl-order allocation contest可以接近于最优ranl-order allocation contest。
- 我的总结:本文的核心贡献在于,针对竞赛设计者提出了两种不同的目标函数,并且将两种目标函数分别在Rank-Order Allocation Contest和General Contest的设置下研究其最优竞赛性质。
三、核心模型
- 基础设定:共有 n n n位参赛者。 v = ( v 1 , v 2 , . . . , v n ) v=(v_1,v_2,...,v_n) v=(v1,v2,...,vn)是参赛者的能力组合, v i v_i vi独立产生于分布 F F F,并且该分布的概率密度函数(PDF)记为 f f f。参赛者同时产生输出 b = ( b 1 , b 2 , . . . , b n ) b=(b_1,b_2,...,b_n) b=(b1,b2,...,bn)。接下来模型的细节将会分两类叙述。
3.1 Rank-Order Allocation Contests
- 竞赛有 n n n个价值递减的奖项 w = ( w 1 , w 2 , . . . , w n ) , 1 ≥ w 1 ≥ w 2 . . . ≥ w n ≥ 0 w=(w_1,w_2,...,w_n),1\ge w_1\ge w_2...\ge w_n \ge 0 w=(w1,w2,...,wn),1≥w1≥w2...≥wn≥0(对于unit-sum模型来说,额外要求 ∑ j w j ≤ 1 \sum_j w_j\le1 ∑jwj≤1)。参赛者根据其输出的排名顺序获得相应奖项。拥有最高输出的参赛者获得 w 1 w_1 w1,拥有第二高输出的参赛者获得 w 2 w_2 w2,以此类推。
- 具体来说,参赛者牺牲代价cost,结合自身type产生output参与排名。即output=cost*type。因此效用函数可以表示如下。其中
P
i
j
P_{ij}
Pij表示参赛者
i
i
i获得第
j
j
j个奖项的概率。为了简化形式,式子两边同乘
v
i
v_i
vi得到下式。
u ( v i , b ) = ∑ j ∈ [ n ] w j P i j − b i v i u ( v i , b ) = v i ∑ j ∈ [ n ] w j P i j − b i P i j = 1 ˉ { b i = b i j } ∣ { k ∣ b k = b i j } ∣ u(v_i,b)=\sum_{j\in [n]}w_jP_{ij}-\frac{b_i}{v_i}\\ u(v_i,b)=v_i\sum_{j\in[n]}w_jP_{ij}-b_i\\ P_{ij}=\frac{\bar{1}\{b_i=b_{ij}\}}{|\{k|b_k=b_{ij}\}|} u(vi,b)=j∈[n]∑wjPij−vibiu(vi,b)=vij∈[n]∑wjPij−biPij=∣{k∣bk=bij}∣1ˉ{bi=bij} - 我们令
p
j
(
v
)
p_j(v)
pj(v)表示值
v
v
v在分布
F
F
F下独立取样是第
j
j
j高的概率,形式化表述如下。(解释一下,
F
(
v
)
F(v)
F(v)表示独立取样值小于等于
v
v
v的概率,那么值
v
v
v是第
j
j
j个大,就有
j
−
1
j-1
j−1个大于
v
v
v,其余小于
v
v
v,由此而得)
n
n
n个独立同分布抽样获得第
j
j
j高的统计结果的概率密度函数如下。
p j ( v ) = ( n − 1 j − 1 ) F ( v ) n − j ( 1 − F ( v ) ) j − 1 f n , j ( v ) = n ! ( j − 1 ) ! ( n − j ) ! F ( v ) n − j ( 1 − F ( v ) ) j − 1 f ( v ) p_j(v)=\tbinom{n-1}{j-1}F(v)^{n-j}(1-F(v))^{j-1}\\ f_{n,j}(v)=\frac{n!}{(j-1)!(n-j)!}F(v)^{n-j}(1-F(v))^{j-1}f(v) pj(v)=(j−1n−1)F(v)n−j(1−F(v))j−1fn,j(v)=(j−1)!(n−j)!n!F(v)n−j(1−F(v))j−1f(v) - 定理1表明:在上述环境设定下,唯一的贝叶斯纳什均衡由下式定义。(决策在于,输入类型,输出最优的输出值(output)。也就是说结合自身类型,选定最优代价,产生最优输出值。)
β ( v ) = ∑ j ∈ [ n ] w j ∫ 0 v t p j ′ ( t ) d t \beta(v)=\sum_{j\in [n]}w_j \int_0^v tp_j'(t)dt β(v)=j∈[n]∑wj∫0vtpj′(t)dt - 何为简单竞赛(Simple Contest)?如果存在一个 j j j,使得排名前 j j j个参赛者每人被分配一个相等的正值奖项,其余参与者获得 0 0 0奖励。
3.2 General Contests
- x i ( v ) x_i(v) xi(v)表示在接受能力组合 v v v后,参赛者 i i i获得的期望奖项价值。无论是unit-range/unit sum,都要求 0 ≤ x i ( v ) ≤ 1 0\le x_i(v)\le 1 0≤xi(v)≤1,另外对于unit-sum还要求 ∑ i x i ( v ) ≤ 1 \sum_i x_i(v)\le 1 ∑ixi(v)≤1。因此相比之下,unit-range更加简单,因为其可以独立优化每位参赛者的决策。
- 分配规则
x
(
v
)
=
(
x
1
(
v
)
,
.
.
.
,
x
n
(
v
)
)
x(v)=(x_1(v),...,x_n(v))
x(v)=(x1(v),...,xn(v)),假设分配规则是对称的,也就是说相同输出不同参与者对应的期望收益是相等的。期望分配函数设计为
ξ
(
v
)
=
E
[
x
i
(
v
)
∣
v
i
=
v
]
\xi(v)=E[x_i(v)|v_i=v]
ξ(v)=E[xi(v)∣vi=v]。贝叶斯纳什均衡下的输出函数为:
β ( v ) = v ξ ( v ) − ∫ o v ξ ( t ) d t \beta(v)=v\xi(v)-\int_o^v\xi(t)dt β(v)=vξ(v)−∫ovξ(t)dt - 定理2:任何非减的期望分配函数
ξ
\xi
ξ满足下式,是可以被某些满足unit-sum约束的分配函数
x
x
x所实现的。
∫ V 1 ξ ( v ) f ( v ) d v ≤ 1 − F ( V ) n n \int_V^1\xi(v)f(v)dv\le \frac{1-F(V)^n}{n} ∫V1ξ(v)f(v)dv≤n1−F(V)n
3.3 Objective Functions
-
接下来形式化定义两种目标函数,分别是二进制门限目标函数(binary threshold)以及线性门限目标函数(linear threshold)
-
Binary Threshold Objective
二进制门限目标函数的意思是,如果输出值大于 B B B那么其对于竞赛设计者产生的效用为1,如果输出值小于 B B B那么其对于竞赛设计者产生的效用为0。
-
Linear Threshold Objective
线性门限值目标函数的含义是,在 B L B_L BL与 B H B_H BH之间的输出值与所产生的效应之间存在着线性关系。
四、分析过程
- 细节较多…
五、本文总结
- (future work)本文中,我们关注于两个自然且实用的竞赛设计者的目标函数,并且我们为这两种目标函数都设计了最优竞赛。一个有趣的开放问题是,一个没有既定输出的竞赛,或者说一个rank-order allocation contest,可以多大程度上接近于general contest的最优程度。另外一个该工作的拓展是研究其他实际的竞赛设计者的目标函数,单调转换形式与本文研究的门限转化形式不同。结合本文对于设计者目标函数的研究以及非线性效用、代价函数也是一个有趣的研究方向。