Contest Design with Threshold Objectives（博弈论+机制设计）论文阅读笔记

最新推荐文章于 2023-08-20 17:54:36 发布

AgentSmart

最新推荐文章于 2023-08-20 17:54:36 发布

阅读量407

点赞数

分类专栏：算法学习博弈论机器学习

本文链接：https://blog.csdn.net/dzc_go/article/details/122024581

版权

机器学习同时被 3 个专栏收录

37 篇文章 7 订阅

订阅专栏

博弈论

24 篇文章 7 订阅

订阅专栏

算法学习

23 篇文章 13 订阅

订阅专栏

Contest Design with Threshold Objectives 论文阅读笔记

一、基本信息

题目：带有门限目标函数的竞赛设计
作者：Edith Elkind、Abheek Ghosh、Paul W. Goldberg

二、文章摘要

以下内容取自原文摘要部分：
我们研究的是一种竞赛，该种竞赛的目标函数是在已经广泛研究的目标函数——最大化输出的基础上拓展的，并且当参赛者的输出水平非常低或者非常高时设计者的边际效用为0。我们考虑两种变体，换言之两种目标函数：二进制门限值（超过门限值对设计者产生1的效用，反之产生0的效用）、线性门限值（在两个门限值之间产生效用与输出成线性关系，其他情况下为常数）。对于这两种目标函数，我们分别研究两种竞赛：rank-order allocation contest（奖项分配只基于参赛者的排名）以及general contest（使用参赛者输出的数字值去分配奖项）。我们分析研究最优化竞赛的性质，并且指出一些有效计算均衡的技巧。我们也证明了在一定情况下，对于线性门限值目标函数，某种ranl-order allocation contest可以接近于最优ranl-order allocation contest。
我的总结：本文的核心贡献在于，针对竞赛设计者提出了两种不同的目标函数，并且将两种目标函数分别在Rank-Order Allocation Contest和General Contest的设置下研究其最优竞赛性质。

三、核心模型

基础设定：共有 $n$ 位参赛者。 $v=(v_1,v_2,...,v_n)$ 是参赛者的能力组合， $v_i$ 独立产生于分布 $F$ ，并且该分布的概率密度函数（PDF）记为 $f$ 。参赛者同时产生输出 $b=(b_1,b_2,...,b_n)$ 。接下来模型的细节将会分两类叙述。

3.1 Rank-Order Allocation Contests

竞赛有 $n$ 个价值递减的奖项 $w=(w_1,w_2,...,w_n),1\ge w_1\ge w_2...\ge w_n \ge 0$ （对于unit-sum模型来说，额外要求 $\sum_j w_j\le1$ ）。参赛者根据其输出的排名顺序获得相应奖项。拥有最高输出的参赛者获得 $w_1$ ，拥有第二高输出的参赛者获得 $w_2$ ，以此类推。
具体来说，参赛者牺牲代价cost，结合自身type产生output参与排名。即output=cost*type。因此效用函数可以表示如下。其中 $P_{ij}$ 表示参赛者 $i$ 获得第 $j$ 个奖项的概率。为了简化形式，式子两边同乘 $v_i$ 得到下式。
$u(v_i,b)=\sum_{j\in [n]}w_jP_{ij}-\frac{b_i}{v_i}\\ u(v_i,b)=v_i\sum_{j\in[n]}w_jP_{ij}-b_i\\ P_{ij}=\frac{\bar{1}\{b_i=b_{ij}\}}{|\{k|b_k=b_{ij}\}|}$
我们令 $p_j(v)$ 表示值 $v$ 在分布 $F$ 下独立取样是第 $j$ 高的概率，形式化表述如下。（解释一下， $F (v)$ 表示独立取样值小于等于 $v$ 的概率，那么值 $v$ 是第 $j$ 个大，就有 $j - 1$ 个大于 $v$ ，其余小于 $v$ ，由此而得） $n$ 个独立同分布抽样获得第 $j$ 高的统计结果的概率密度函数如下。
$p_j(v)=\tbinom{n-1}{j-1}F(v)^{n-j}(1-F(v))^{j-1}\\ f_{n,j}(v)=\frac{n!}{(j-1)!(n-j)!}F(v)^{n-j}(1-F(v))^{j-1}f(v)$
定理1表明：在上述环境设定下，唯一的贝叶斯纳什均衡由下式定义。（决策在于，输入类型，输出最优的输出值（output）。也就是说结合自身类型，选定最优代价，产生最优输出值。）
$\beta(v)=\sum_{j\in [n]}w_j \int_0^v tp_j'(t)dt$
何为简单竞赛（Simple Contest）？如果存在一个 $j$ ，使得排名前 $j$ 个参赛者每人被分配一个相等的正值奖项，其余参与者获得 $0$ 奖励。

3.2 General Contests

$x_i(v)$ 表示在接受能力组合 $v$ 后，参赛者 $i$ 获得的期望奖项价值。无论是unit-range/unit sum，都要求 $0\le x_i(v)\le 1$ ，另外对于unit-sum还要求 $\sum_i x_i(v)\le 1$ 。因此相比之下，unit-range更加简单，因为其可以独立优化每位参赛者的决策。
分配规则 $x(v)=(x_1(v),...,x_n(v))$ ，假设分配规则是对称的，也就是说相同输出不同参与者对应的期望收益是相等的。期望分配函数设计为 $\xi(v)=E[x_i(v)|v_i=v]$ 。贝叶斯纳什均衡下的输出函数为：
$\beta(v)=v\xi(v)-\int_o^v\xi(t)dt$
定理2：任何非减的期望分配函数 $\xi$ 满足下式，是可以被某些满足unit-sum约束的分配函数 $x$ 所实现的。
$\int_V^1\xi(v)f(v)dv\le \frac{1-F(V)^n}{n}$

3.3 Objective Functions

接下来形式化定义两种目标函数，分别是二进制门限目标函数（binary threshold）以及线性门限目标函数（linear threshold）
Binary Threshold Objective
二进制门限目标函数的意思是，如果输出值大于 $B$ 那么其对于竞赛设计者产生的效用为1，如果输出值小于 $B$ 那么其对于竞赛设计者产生的效用为0。
Linear Threshold Objective
线性门限值目标函数的含义是，在 $B_L$ 与 $B_H$ 之间的输出值与所产生的效应之间存在着线性关系。

四、分析过程

细节较多…

五、本文总结

（future work）本文中，我们关注于两个自然且实用的竞赛设计者的目标函数，并且我们为这两种目标函数都设计了最优竞赛。一个有趣的开放问题是，一个没有既定输出的竞赛，或者说一个rank-order allocation contest，可以多大程度上接近于general contest的最优程度。另外一个该工作的拓展是研究其他实际的竞赛设计者的目标函数，单调转换形式与本文研究的门限转化形式不同。结合本文对于设计者目标函数的研究以及非线性效用、代价函数也是一个有趣的研究方向。

AgentSmart

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Contest Design with Threshold Objectives（博弈论+机制设计）论文阅读笔记

Contest Design with Threshold Objectives 论文阅读笔记一、基本信息二、文章摘要三、核心模型一、基本信息题目：作者：Edith Elkind、Abheek Ghosh、Paul W. Goldberg二、文章摘要以下内容取自原文摘要部分：我的总结：三、核心模型...
复制链接

扫一扫