近期几篇有关All-Pay论文总结（博弈论+机制设计）

AgentSmart

于 2022-03-05 15:44:08 发布

阅读量929

点赞数

分类专栏：机器学习算法学习博弈论文章标签：人工智能算法概率论

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dzc_go/article/details/123294576

版权

本文总结了几篇关于All-Pay拍卖的论文，涉及一价拍卖的Nash收敛、最优竞赛设计、不完全信息条件下的奖励优化及均衡存在性证明。研究涵盖均衡学习算法、参赛者效用函数、奖励策略及其对竞赛设计的影响，同时探讨了全支付拍卖的实验研究结果，指出在重复博弈中学习算法的行为和均衡的关系。

摘要由CSDN通过智能技术生成

近期几篇有关All-Pay论文总结

1.Nash Convergence of Mean-Based Learning Algorithms in First Price Auctions

目前在线广告竞拍中大多采用重复一价拍卖代替过去的二价拍卖。一价拍卖不可信，因此策略选择成为关键。重复博弈的特点使得学习算法可以成为策略选择的工具。本文研究基于均值的学习算法在重复一价拍卖中的收敛情况。本文模型简单，可直接计算证明出均衡，通过模拟实验的方法比对实验结果与均衡，从而印证结论。
内容涉及：重复博弈、在线学习算法、无悔算法、简单模型的均衡计算、学习算法在不同条件下（最高估值参赛者个数）是否会收敛到均衡。
模型：参赛者集合 $N=\{1,2,...,n\},n\ge 2$ 。单一卖家拍卖单一物品无限轮次。每位竞价者都对物品有着固定的估值 $v^i$ （不随轮次改变）。假设 $v^1\ge v^2\ge ... \ge v^N$ 。在每一轮 $t\ge 1$ 中，每位竞价者产生竞价 $b_t^i\in \{0,1,...,V\}$ 。竞价最高者得并且支付其竞价，其他人不用支付竞价，如果出现平局情况，则在候选人中随机产生一位胜者。每个人的出价范围是 $B^i=\{0,1,...,v^i-1\}$ 。竞价者 $i$ 的期望效用函数为：（ $\bold{1}[b_i=max_{j\in N}b^j_t]$ 是指当满足中括号内条件时值为1，否则为0；因为是期望收益，所以最后乘以分数表示平局情况）（一价、赢者支付竞价、不同轮次估值相同、不同参赛者估值不同）
$u^i(b_t^i,\bold{b^{-i}_t})=(v^i-b^i_t)\bold{1}[b_i=max_{j\in N}b^j_t]\frac{1}{|argmax_{j\in N}b_t^j|}$

最低0.47元/天解锁文章

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。