近期几篇有关All-Pay论文总结(博弈论+机制设计)

本文总结了几篇关于All-Pay拍卖的论文,涉及一价拍卖的Nash收敛、最优竞赛设计、不完全信息条件下的奖励优化及均衡存在性证明。研究涵盖均衡学习算法、参赛者效用函数、奖励策略及其对竞赛设计的影响,同时探讨了全支付拍卖的实验研究结果,指出在重复博弈中学习算法的行为和均衡的关系。
摘要由CSDN通过智能技术生成

1.Nash Convergence of Mean-Based Learning Algorithms in First Price Auctions
  • 目前在线广告竞拍中大多采用重复一价拍卖代替过去的二价拍卖。一价拍卖不可信,因此策略选择成为关键。重复博弈的特点使得学习算法可以成为策略选择的工具。本文研究基于均值的学习算法在重复一价拍卖中的收敛情况。本文模型简单,可直接计算证明出均衡,通过模拟实验的方法比对实验结果与均衡,从而印证结论。
  • 内容涉及:重复博弈、在线学习算法、无悔算法、简单模型的均衡计算、学习算法在不同条件下(最高估值参赛者个数)是否会收敛到均衡。
  • 模型:参赛者集合 N = { 1 , 2 , . . . , n } , n ≥ 2 N=\{1,2,...,n\},n\ge 2 N={ 1,2,...,n},n2。单一卖家拍卖单一物品无限轮次。每位竞价者都对物品有着固定的估值 v i v^i vi(不随轮次改变)。假设 v 1 ≥ v 2 ≥ . . . ≥ v N v^1\ge v^2\ge ... \ge v^N v1v2...vN。在每一轮 t ≥ 1 t\ge 1 t1中,每位竞价者产生竞价 b t i ∈ { 0 , 1 , . . . , V } b_t^i\in \{0,1,...,V\} bti{ 0,1,...,V}。竞价最高者得并且支付其竞价,其他人不用支付竞价,如果出现平局情况,则在候选人中随机产生一位胜者。每个人的出价范围是 B i = { 0 , 1 , . . . , v i − 1 } B^i=\{0,1,...,v^i-1\} Bi={ 0,1,...,vi1}。竞价者 i i i的期望效用函数为:( 1 [ b i = m a x j ∈ N b t j ] \bold{1}[b_i=max_{j\in N}b^j_t] 1[bi=maxjNbtj]是指当满足中括号内条件时值为1,否则为0;因为是期望收益,所以最后乘以分数表示平局情况)(一价、赢者支付竞价、不同轮次估值相同、不同参赛者估值不同
    u i ( b t i , b t − i ) = ( v i − b t i ) 1 [ b i = m a x j ∈ N b t j ] 1 ∣ a r g m a x j ∈ N b t j ∣ u^i(b_t^i,\bold{b^{-i}_t})=(v^i-b^i_t)\bold{1}[b_i=max_{j\in N}b^j_t]\frac{1}{|argmax_{j\in N}b_t^j|} ui(bti,bt
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值