Contest Design with Threshold Objectives(博弈论+机制设计) 论文阅读笔记

一、基本信息

  • 题目:带有门限目标函数的竞赛设计
  • 作者:Edith Elkind、Abheek Ghosh、Paul W. Goldberg

二、文章摘要

  • 以下内容取自原文摘要部分:
  • 我们研究的是一种竞赛,该种竞赛的目标函数是在已经广泛研究的目标函数——最大化输出的基础上拓展的,并且当参赛者的输出水平非常低或者非常高时设计者的边际效用为0。我们考虑两种变体,换言之两种目标函数:二进制门限值(超过门限值对设计者产生1的效用,反之产生0的效用)、线性门限值(在两个门限值之间产生效用与输出成线性关系,其他情况下为常数)。对于这两种目标函数,我们分别研究两种竞赛:rank-order allocation contest(奖项分配只基于参赛者的排名)以及general contest(使用参赛者输出的数字值去分配奖项)。我们分析研究最优化竞赛的性质,并且指出一些有效计算均衡的技巧。我们也证明了在一定情况下,对于线性门限值目标函数,某种ranl-order allocation contest可以接近于最优ranl-order allocation contest
  • 我的总结:本文的核心贡献在于,针对竞赛设计者提出了两种不同的目标函数,并且将两种目标函数分别在Rank-Order Allocation ContestGeneral Contest的设置下研究其最优竞赛性质。

三、核心模型

  • 基础设定:共有 n n n位参赛者。 v = ( v 1 , v 2 , . . . , v n ) v=(v_1,v_2,...,v_n) v=(v1,v2,...,vn)是参赛者的能力组合, v i v_i vi独立产生于分布 F F F,并且该分布的概率密度函数(PDF)记为 f f f。参赛者同时产生输出 b = ( b 1 , b 2 , . . . , b n ) b=(b_1,b_2,...,b_n) b=(b1,b2,...,bn)接下来模型的细节将会分两类叙述
3.1 Rank-Order Allocation Contests
  • 竞赛有 n n n个价值递减的奖项 w = ( w 1 , w 2 , . . . , w n ) , 1 ≥ w 1 ≥ w 2 . . . ≥ w n ≥ 0 w=(w_1,w_2,...,w_n),1\ge w_1\ge w_2...\ge w_n \ge 0 w=(w1,w2,...,wn),1w1w2...wn0(对于unit-sum模型来说,额外要求 ∑ j w j ≤ 1 \sum_j w_j\le1 jwj1)。参赛者根据其输出的排名顺序获得相应奖项。拥有最高输出的参赛者获得 w 1 w_1 w1,拥有第二高输出的参赛者获得 w 2 w_2 w2,以此类推。
  • 具体来说,参赛者牺牲代价cost,结合自身type产生output参与排名。即output=cost*type。因此效用函数可以表示如下。其中 P i j P_{ij} Pij表示参赛者 i i i获得第 j j j个奖项的概率。为了简化形式,式子两边同乘 v i v_i vi得到下式。
    u ( v i , b ) = ∑ j ∈ [ n ] w j P i j − b i v i u ( v i , b ) = v i ∑ j ∈ [ n ] w j P i j − b i P i j = 1 ˉ { b i = b i j } ∣ { k ∣ b k = b i j } ∣ u(v_i,b)=\sum_{j\in [n]}w_jP_{ij}-\frac{b_i}{v_i}\\ u(v_i,b)=v_i\sum_{j\in[n]}w_jP_{ij}-b_i\\ P_{ij}=\frac{\bar{1}\{b_i=b_{ij}\}}{|\{k|b_k=b_{ij}\}|} u(vi,b)=j[n]wjPijvibiu(vi,b)=vij[n]wjPijbiPij={kbk=bij}1ˉ{bi=bij}
  • 我们令 p j ( v ) p_j(v) pj(v)表示值 v v v在分布 F F F下独立取样是第 j j j高的概率,形式化表述如下。(解释一下, F ( v ) F(v) F(v)表示独立取样值小于等于 v v v的概率,那么值 v v v是第 j j j个大,就有 j − 1 j-1 j1个大于 v v v,其余小于 v v v,由此而得 n n n个独立同分布抽样获得第 j j j高的统计结果的概率密度函数如下。
    p j ( v ) = ( n − 1 j − 1 ) F ( v ) n − j ( 1 − F ( v ) ) j − 1 f n , j ( v ) = n ! ( j − 1 ) ! ( n − j ) ! F ( v ) n − j ( 1 − F ( v ) ) j − 1 f ( v ) p_j(v)=\tbinom{n-1}{j-1}F(v)^{n-j}(1-F(v))^{j-1}\\ f_{n,j}(v)=\frac{n!}{(j-1)!(n-j)!}F(v)^{n-j}(1-F(v))^{j-1}f(v) pj(v)=(j1n1)F(v)nj(1F(v))j1fn,j(v)=(j1)!(nj)!n!F(v)nj(1F(v))j1f(v)
  • 定理1表明:在上述环境设定下,唯一的贝叶斯纳什均衡由下式定义。(决策在于,输入类型,输出最优的输出值(output)。也就是说结合自身类型,选定最优代价,产生最优输出值。
    β ( v ) = ∑ j ∈ [ n ] w j ∫ 0 v t p j ′ ( t ) d t \beta(v)=\sum_{j\in [n]}w_j \int_0^v tp_j'(t)dt β(v)=j[n]wj0vtpj(t)dt
  • 何为简单竞赛(Simple Contest)?如果存在一个 j j j,使得排名前 j j j个参赛者每人被分配一个相等的正值奖项,其余参与者获得 0 0 0奖励。
3.2 General Contests
  • x i ( v ) x_i(v) xi(v)表示在接受能力组合 v v v后,参赛者 i i i获得的期望奖项价值。无论是unit-range/unit sum,都要求 0 ≤ x i ( v ) ≤ 1 0\le x_i(v)\le 1 0xi(v)1,另外对于unit-sum还要求 ∑ i x i ( v ) ≤ 1 \sum_i x_i(v)\le 1 ixi(v)1。因此相比之下,unit-range更加简单,因为其可以独立优化每位参赛者的决策。
  • 分配规则 x ( v ) = ( x 1 ( v ) , . . . , x n ( v ) ) x(v)=(x_1(v),...,x_n(v)) x(v)=(x1(v),...,xn(v)),假设分配规则是对称的,也就是说相同输出不同参与者对应的期望收益是相等的。期望分配函数设计为 ξ ( v ) = E [ x i ( v ) ∣ v i = v ] \xi(v)=E[x_i(v)|v_i=v] ξ(v)=E[xi(v)vi=v]。贝叶斯纳什均衡下的输出函数为:
    β ( v ) = v ξ ( v ) − ∫ o v ξ ( t ) d t \beta(v)=v\xi(v)-\int_o^v\xi(t)dt β(v)=vξ(v)ovξ(t)dt
  • 定理2:任何非减的期望分配函数 ξ \xi ξ满足下式,是可以被某些满足unit-sum约束的分配函数 x x x所实现的。
    ∫ V 1 ξ ( v ) f ( v ) d v ≤ 1 − F ( V ) n n \int_V^1\xi(v)f(v)dv\le \frac{1-F(V)^n}{n} V1ξ(v)f(v)dvn1F(V)n
3.3 Objective Functions
  • 接下来形式化定义两种目标函数,分别是二进制门限目标函数(binary threshold)以及线性门限目标函数(linear threshold

  • Binary Threshold Objective
    二进制门限目标函数的意思是,如果输出值大于 B B B那么其对于竞赛设计者产生的效用为1,如果输出值小于 B B B那么其对于竞赛设计者产生的效用为0。
    在这里插入图片描述

  • Linear Threshold Objective
    线性门限值目标函数的含义是,在 B L B_L BL B H B_H BH之间的输出值与所产生的效应之间存在着线性关系。
    在这里插入图片描述

四、分析过程

  • 细节较多…

五、本文总结

  • future work)本文中,我们关注于两个自然且实用的竞赛设计者的目标函数,并且我们为这两种目标函数都设计了最优竞赛。一个有趣的开放问题是,一个没有既定输出的竞赛,或者说一个rank-order allocation contest,可以多大程度上接近于general contest的最优程度。另外一个该工作的拓展是研究其他实际的竞赛设计者的目标函数,单调转换形式与本文研究的门限转化形式不同。结合本文对于设计者目标函数的研究以及非线性效用、代价函数也是一个有趣的研究方向。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值