近期几篇有关All-Pay论文总结
-
-
-
- 1.Nash Convergence of Mean-Based Learning Algorithms in First Price Auctions
- 2.Designing an optimal contest
- 3.Optimal rewards in contests
- 4.Asymmetric All-Pay Auctions with Incomplete Information:The Two-Player Case
- 5.Asymmetric All-Pay Auctions with Two Types
- 6.All-pay auctions—an experimental study
- 7.后续
-
-
1.Nash Convergence of Mean-Based Learning Algorithms in First Price Auctions
- 目前在线广告竞拍中大多采用重复一价拍卖代替过去的二价拍卖。一价拍卖不可信,因此策略选择成为关键。重复博弈的特点使得学习算法可以成为策略选择的工具。本文研究基于均值的学习算法在重复一价拍卖中的收敛情况。本文模型简单,可直接计算证明出均衡,通过模拟实验的方法比对实验结果与均衡,从而印证结论。
- 内容涉及:重复博弈、在线学习算法、无悔算法、简单模型的均衡计算、学习算法在不同条件下(最高估值参赛者个数)是否会收敛到均衡。
- 模型:参赛者集合 N = { 1 , 2 , . . . , n } , n ≥ 2 N=\{1,2,...,n\},n\ge 2 N={
1,2,...,n},n≥2。单一卖家拍卖单一物品无限轮次。每位竞价者都对物品有着固定的估值 v i v^i vi(不随轮次改变)。假设 v 1 ≥ v 2 ≥ . . . ≥ v N v^1\ge v^2\ge ... \ge v^N v1≥v2≥...≥vN。在每一轮 t ≥ 1 t\ge 1 t≥1中,每位竞价者产生竞价 b t i ∈ { 0 , 1 , . . . , V } b_t^i\in \{0,1,...,V\} bti∈{
0,1,...,V}。竞价最高者得并且支付其竞价,其他人不用支付竞价,如果出现平局情况,则在候选人中随机产生一位胜者。每个人的出价范围是 B i = { 0 , 1 , . . . , v i − 1 } B^i=\{0,1,...,v^i-1\} Bi={
0,1,...,vi−1}。竞价者 i i i的期望效用函数为:( 1 [ b i = m a x j ∈ N b t j ] \bold{1}[b_i=max_{j\in N}b^j_t] 1[bi=maxj∈Nbtj]是指当满足中括号内条件时值为1,否则为0;因为是期望收益,所以最后乘以分数表示平局情况)(一价、赢者支付竞价、不同轮次估值相同、不同参赛者估值不同)
u i ( b t i , b t − i ) = ( v i − b t i ) 1 [ b i = m a x j ∈ N b t j ] 1 ∣ a r g m a x j ∈ N b t j ∣ u^i(b_t^i,\bold{b^{-i}_t})=(v^i-b^i_t)\bold{1}[b_i=max_{j\in N}b^j_t]\frac{1}{|argmax_{j\in N}b_t^j|} ui(bti,bt