All-Pay Contests 论文定理推导（博弈论+机制设计）

本文链接：https://blog.csdn.net/dzc_go/article/details/123093469

All-Pay Contests 论文定理推导（博弈论+机制设计）

本文针对于全支付竞赛（准确来说是标准竞赛）提出两大结论：Theorem 1有关标准竞赛中参赛者的均衡收益情况；Theorem 2有关标准竞赛中参赛者的均衡参与情况。 Theorem1、2需依赖于均衡存在性定理（原文中Corollary 1）。因此本文证明大体分为三部分。
三部分的证明之间存在联系。Corollary 1证明独立，是Theorem1,2成立的基础。Theorem 1证明依赖于Generic Condition。Theorem 2证明依赖于Generic Condition与Theorem 1。

一、Theorem 1 证明过程

总体来说：Theorem 1的证明分为四部分，提出四个Lemma并分别证明，四个Lemma组合可推出Theorem 1的内容。（基于Generic Condition+均衡存在性）
Theorem 1内容：在标准竞赛的任意均衡中，每个参赛者的期望收益都等于其power值与0之间的较大值。（ $N_W$ 中参赛者期望收益为power， $N_L$ 中参赛者期望收益为0。）
选择一个标准竞赛以及一个竞赛的均衡 $G=(G_1,...,G_N)$ 。（任意标准竞赛均衡存在+任意竞赛的任意均衡满足定理1 $\rightarrow$ 定理1得以证明）

LEAST LEMMA：参赛者在任意均衡 $G$ 中的期望收益至少等于其power与0之间的较大值。
证明：初始分数的存在使得每位参赛者的收益都大于等于0（ $N_L$ 中参赛者 $i$ 选择分数 $s_i\in[a_i,r_i)$ ，如果获胜那么期望收益为正，如果失败那么不如选择初始分数保证收益为0）。参赛者划分为 $N_W,N_L$ 两部分， $N_L$ 中参赛者power小于0故已满足引理。 $N_W$ 中任意参赛者选择分数 $max\{a_i,T+\epsilon\},\epsilon>0$ 都可以打败 $N_L$ 中所有 $n - m$ 位参赛者而获胜（ $N_L$ 中参赛者reach<T，因此不会出价大于等于T）。由此可得：（参赛者 $i$ 百分百选择最高的分数获胜，伴随着最大的代价，因此是期望收益的下界）
$u_i\ge v_i(max\{a_i,T+\epsilon\})\rightarrow_{\epsilon\rightarrow0}v_i(max\{a_i,T\})=w_i$
由上式可得 $N_W$ 中参赛则期望收益大于等于其power（ $N_W$ 中参赛则的power>0）。综上，LEAST LEMMA得证。
作用：证明了任意均衡中所有参赛者期望收益都至少为power与0之间的较大值（定理1的下界部分）。

TIE LEMMA：假设在均衡 $G$ 中两个以上的参赛者为分数 $x$ 分配了概率，也就是说以严格正值概率选择 $x$ 。那么为分数 $x$ 分配了概率的参赛者们如果选择 $x$ 要么一定一起获胜要么一定一起失败。
证明：为分数 $x$ 分配了概率的参赛者集合为 $N',|N'|\ge 2$ 。事件 $N^{'}$ 中所有参赛者选择分数 $x$ 定义为 $E$ 。 $x$ 为获奖分数并且 $x$ 出现同分数的事件定义为 $D$ （ $m^{'}$ 个奖项分配给 $N^{'}$ 中 $∣ N^{'} ∣$ 个参赛者，且 $1\le m' <|N'|$ ）。假设 $D$ 有严格正值概率，在 $D$ 的基础上，至少有一位参赛者 $i\in N'$ 可以通过选择略大于 $x$ 的分数从而获胜。因此事件 $D$ 并不满足最优响应，换句话说任意均衡中不可能出现事件 $D$ 。因此 $P(E)=P(E^L)+P(E^W)$ ，其中， $P(E^L)$ 表示出现事件 $E$ 且 $N^{'}$ 中所有参赛者全部失败， $P(E^W)$ 表示出现事件 $E$ 且 $N^{'}$ 中所有参赛者全部获胜， $D$ 事件不存在均衡中，因此无第三种部分获胜部分失败的情况。因此在 $E$ 的基础上，要么 $E^W$ 成立要么 $E^L$ 成立。TIE LEMMA得证。
作用：均衡中可能会有多位参赛者为某个分数附以概率。TIE LEMMA消除了那些平分数参赛者中部分获胜的情况。均衡中无上述情况有助于确定哪些参赛者的期望收益为0。
（该引理说的是，在均衡中不会出现平局卡在分数 $x$ 上，因为从结果反推的角度，平局中至少有一个参赛者可以略微提高分数从而必胜。但实际上，参赛者不会知道是否会发生平局，因此也无法做出策略调整规避掉平局的均衡？其实还是考虑博弈的过程是否会向着均衡的方向演化）

ZERO LEMMA：在均衡 $G$ 中，至少有 $n - m$ 位参赛者针对于他们获胜概率等于0或者接近于0的情况做出最优响应。这些参赛者期望收益最大是0。
证明：用 $J$ 表示某个 $m + 1$ 位参赛者的集合。用 $\tilde{S}$ 表示 $J$ 中参赛者最优响应集合的联合。用 $s_{inf}$ 表示 $\tilde{S}$ （笛卡尔积）的下确界。一共有三种情况：（1） $J$ 有两个及以上的参赛者针对分数 $s_{inf}$ 附以正值概率。（2） $J$ 只有一个的参赛者针对分数 $s_{inf}$ 附以正值概率。（3） $J$ 没有参赛者针对分数 $s_{inf}$ 附以正值概率。
情况（1）：用 $N^{'}$ 表示 $J$ 中针对分数 $s_{inf}$ 附以正值概率的参赛者。对于 $N^{'}$ 中每位参赛者来说不可能成立 $P_i(s_{inf})=1$ ，由此根据TIE LEMMA得到：对于 $N^{'}$ 中每位参赛者来说一定成立 $P_i(s_{inf})=0$ 。
情况（2）：用 $i$ 来表示 $J$ 中唯一一个针对分数 $s_{inf}$ 附以正值概率的参赛者。 $P_i(s_{inf})=0$ 一定成立（因为 $J$ 中其余m位参赛者选择分数一定大于 $s_{inf}$ ）。由此(1)(2)可得：任意m+1位参赛者的集合 $J$ 中，可能选择分数下确界的参赛者一定成立 $P_i(s_{inf})=0$ ，并且针对获胜概率为0的情况选择分数 $s_{inf}$ 也是其最优响应。
情况（3）：根据下确界 $s_{inf}$ 的定义，一定存在某位参赛者i其最优响应 $\{x_n\}^\infty _{n=1}$ 接近于 $s_{inf}$ 。当 $n$ 趋向于无穷时， $P_i(x_n)$ 接近于0。
因为 $J$ 是任意一个包含m+1位参赛者的集合，因此任意均衡中至少有n-m位参赛者是针对其获胜概率等于0或接近于0做出的最优响应。（类似鸽笼原理，假设只有n-m-1个人成立，那么存在某个m+1个人中没有人成立）获胜概率等于0或接近于0，那么期望收益至多为0。
作用： $N_L$ 中 $n - m$ 位参赛者的任意均衡下期望收益为0。（LEAST LEMMA中得到 $N_W$ 中参赛者期望收益至少为Power，那么n-m个只能是 $N_L$ 中的。）

THRESHOLD LEMMA： $N_W$ 中的参赛者最优响应是接近或者超过threshold，因此期望收益最多为其power值。
证明：1.对于 $\ { m + 1 } N_L\backslash \{m+1\}$ 中的参赛者来说，其最优响应的上确界为 $s_{sup}<T$ 。为了证明 $N_W$ 中每位参赛者都为接近或者超过threshold的分数附以了概率，使用反证法。假设存在一位 $N_W$ 中参赛者，没有为接近或者超过threshold的分数附以概率。那么marginal player可以纯策略在范围 $max\{a_{m+1},s\},T)$ 中选择分数从而百分百赢得比赛。此时marginal player期望收益为正，与上面结论相违背。（证明 $N_W$ 中参赛者的最优响应）
2.在 $N_W$ 中任选一位参赛者 $i$ 。其最优响应 $\{x_n\}^\infty _{n=1}$ 接近于某个 $z_i\ge T$ 。根据LEAST LEMMA， $v_i(x_n)>0$ 。根据 $v_i$ 的连续性，我们可以得到：（证明 $N_W$ 中参赛者的期望收益上界）
$u_i=u_i(x_n)=P_i(x_n)v_i(x_n)-(1-P_i(x_n))c_i(x_n)\le v_i(x_n)\\ \rightarrow_{x_n\rightarrow z_i}v_i(z_i)\le v_i(T)=w_i$
作用：证明了 $N_W$ 中参赛者期望收益的上界为power。
综合以上引理及其证明。LEAST LEMMA与THRESHOLD LEMMA共同证明了 $N_W$ 中参赛者所有均衡下期望收益等于其power。TIE LEMMA辅助证明ZERO LEMMA，从而证明了 $N_L$ 中参赛者所有均衡下期望收益等于0。（均在标准竞赛的前提下）综合上述两点，定理1得证。

二、Theorem 2 证明过程

总体来说：Theorem 2的证明采用反证法，通过假设反面推理与已证明的Theorem 1部分结论产生矛盾。（基于Generic Condition+均衡存在性+Theorem 1）
正常情况下，全支付竞赛所有参赛者的初始分数都是0，不存在初始优势。因此m+1以后的参赛者很少会参与。
每位参赛者的伯努利效用函数除以 $u_i(a_i)$ 后并不影响均衡中所有参赛者的策略表现，（伯努利效用函数为： $u_i(s)=P_i(s)v_i(s_i)-(1-P_i(s))c_i(s_i)$ ）因此利用所有参赛者 $u_i(a_i)=1$ 的竞赛证明即可代表所有竞赛。（这也是为何定理2中有正则化）
证明方法使用反证法。选择该竞赛中的一个均衡 $G$ ，假设存在某位参赛者 $i > m + 1$ 满足定理2的条件并且参与到了竞赛中。即
$\frac{c_{m+1}(max\{a_{m+1},x\})}{v_{m+1}(a_{m+1})}<\frac{c_i(x)}{v_i(a_i)}\text{ for all $x\in S_i$}\\ \frac{v_{m+1}(max\{a_{m+1},x\})}{v_{m+1}(a_{m+1})}\ge\frac{v_i(x)}{v_i(a_i)}\text{ for all $x\in S_i$}\\$
令 $t_i=inf\{x:G_i(x)=1\}<T$ 。 $t_i$ 可理解为参赛者 $i$ 混合策略中所选择分数的最大值， $t_i\le r_i<T$ 。令 $\tilde{t_i}=max\{a_{m+1},t_i\}<T$ ，那么 $P_i(t_i)<1$ （由Threshold引理证明过程可得， $N_W$ 中m位参赛者选择分数接近或者超过threshold，参赛者 $i$ 最高分数才为 $t_i<T$ ，因此不可能必胜），并且对于任意 $\delta>0:P_{m+1}(\tilde{t_i}+\delta)\ge P_i(t_i)$ （ $\tilde{t_i}+\delta>t_i$ ，在奖项估值相同为1且代价函数递增的情况下，分数越高获奖概率越大，也称为竞赛的单调性）（竞赛的单调性也是可研究的因素）。因此对于任意 $\delta>0$ 使得 $\tilde{t_i}+\delta<r_{m+1}=T$ 我们有：
$v_{m+1}(\tilde{t_i}+\delta)>0\ge -c_{m+1}(\tilde{t_i}+\delta))$
上式的含义是，参赛者m+1选择分数 $\tilde{t_i}+\delta$ 时代价函数大于等于0且获胜效用大于0。
我们可以得到：
$u_{m+1}\ge P_{m+1}(\tilde{t_i}+\delta)v_{m+1}(\tilde{t_i}+\delta)-(1-P_{m+1}(\tilde{t_i}+\delta))c_{m+1}(\tilde{t_i}+\delta)\\ \ge P_i(t_i)v_{m+1}(\tilde{t_i}+\delta)-(1-P_i(t_i))c_{m+1}(\tilde{t_i}+\delta)\\ \text{(根据$P_{m+1}(\tilde{t_i}+\delta)\ge P_i(t_i)$)}$
根据定理2中的定义可得， $c_i(t_i)>c_{m+1}(\tilde{t_i}+\delta),v_{m+1}(\tilde{t_i}+\delta)\ge v_i(t_i)$ ，由此可得：
$P_i(t_i)v_{m+1}(\tilde{t_i}+\delta)-(1-P_i(t_i))c_{m+1}(\tilde{t_i}+\delta)\\ \\>P_i(t_i)v_i(t_i)-(1-P_i(t_i))c_i(t_i)=u_i(t_i)\ge 0$
由此可得 $u_{m+1}>u_i(t_i)\ge 0$ ，即 $u_{m+1}>0$ 这有违定理1。（定理1表明 $u_{m+1}=0$ ）根据反证法可得，定理2成立。

三、Corollary 1 证明过程

总体来说：Corollary 1的证明通过特殊化竞赛，利用一些现有结论或特殊性质找到一定存在的均衡，再证明该均衡也存在于原竞赛中即可。（该部分证明独立）
推论1：所有的全支付竞赛中都存在均衡。
考虑一个竞赛 $C$ 与一个受限的竞赛 $C^{'}$ ，其中每位参赛者选择分数在 $S_i'=[a_i,K],K=max_{i\in N}r_i<\infty$ 范围内。（正常竞赛每位参赛者的分数选择范围是 $[a_i,\infty)$ ）任何 $C^{'}$ 中的均衡都是 $C$ 中的均衡（K是所有参赛者最大的reach，选择大于K的分数一定使得任何参赛者收益为负，不如选择初始分数收入为0），因此我们只要证明 $C^{'}$ 中一定存在均衡即可。
令 $\ { ( s 1 , . . . , s n ) ∣ ∃ i ≠ j : s i = s j } S^*=\times _{i\in N}S_i'\backslash \{(s_1,...,s_n)|\exists i\neq j:s_i=s_j\}$ ，换句话说 $S^*$ 是所有参赛者备选分数组合然后去掉存在相同分数选择的情况。根据Simon and Zame的研究成果，存在某种打破平局规则，从而使得 $C^{'}$ 有一个混合策略均衡 $G$ 。将应用了该种打破平局规则的竞赛表示为 $\tilde{C}$ ，均衡 $G$ 中参赛者的收益为 $\tilde{u_i}$ 。我们只需证明竞赛 $\tilde{C}$ 中的均衡 $G$ 也是竞赛 $C^{'}$ 的均衡即可。换句话说，只需证明在 $C^{'}$ 中 $G$ 的混合策略对每位参赛者来说都是最优响应即可。
证明分两步骤进行。第一步证明在竞赛 $C^{'}$ 中按照均衡 $G$ 的混合策略决策，参赛者的效用等于 $\tilde{u_i}$ 。第二步证明不存在其他分数选择使参赛者获得相较于 $\tilde{u_i}$ 的更高收益。综上 $G$ 中混合策略在竞赛 $C^{'}$ 中也是最优响应，即 $G$ 也是竞赛 $C^{'}$ 的均衡。从而证明了 $C^{'}$ 中一定存在均衡，从而得到任意全支付竞赛中都存在均衡。

四、存在的问题

1.Corollary 1的证明过程中通过特殊化竞赛以及利用现有结论证明均衡存在性，请问该方法是否是均衡存在性证明的一贯方法？
2.Tie-Breaking Rule在证明中多次出现，该因素是不是影响竞赛表现的一大关键因素？有无文章关注于该因素？
3.最优响应为何表示为矩阵序列 $\{x_n\}^\infty_{n=1}$ ？n趋向于无穷的极限代表着什么？