算法博弈论【美-蒂姆拉夫加登】

学习笔记---研究优化算法

第二章 机制设置

2.1 单物品拍卖

n个竞拍者都有各自的非负估值v_i{} (最高估值)

拟线性效用模型:如果i竞拍失败,效用为0;如果以价格p竞拍成功,效用为vi-p.

2.2 密封价格拍卖

竞拍者i私下给卖价报价bi;

卖价决定谁成功;

卖家决定卖出的价格。

2.3 一价拍卖

2.4 二价拍卖和占优策略

即维克里拍卖,密封拍卖形式。最高报价者赢,支付第二高报价。

占优策略

命题2.1(二价拍卖动机)竞拍者i都有占优策略,即将自己的报价bi设定为自己的估值vi

proof:竞拍者i的估值为vi,其他人的报价组合为b_{-i}(即从所有人的报价组合b中移除i的报价所形成的向量)。sub to :i的效用在bi=vi时最大。

B=max_{j\neq i}b_{j}表示除i以外的最高报价。如果bi<B,则i输,效用为0;如果bi≥B,则i赢,支付价格为B,效用为vi-B.

i的估值情况:vi<B,i的最高效用max{0,vi-B}=0,当如实报告自己的估值时,i将输掉拍卖并实现效用最大化。vi≥B,i的最高效用max{0,vi-B}=vi-B,当如实报告自己的估值时,i将赢得拍卖并实现效用最大化。

命题2.2(非负效用) 二价拍卖能保证每一个说振华的竞拍者效用不为负。

proof:输家效用为0.赢家i的效用为vi-p,p为第二高报价。i最高报价且说真话,所以p≤vi,即vi-p≥0.

2.5 理想化拍卖

定义2.3(占优策略激励相容)如果对于每一个竞拍者都按照自己的估值真实报价都是一个占优策略,并且真实报价的竞拍者的效用都非负(个体理性IR),则称之为占优策略激励相容的(Dominant-Strategy Incentive Compatible,DSIC)。

单物品拍卖结果的社会福利为\sum_{i=1}^{n}v_{i}x_{i},其中xi∈{0,1},因为只有一个物品,约束条件为\sum_{i=1}^{n}x_{i}\leqslant 1.

社会福利就是赢家的估值,没有赢家社会福利为0.如果所有的竞拍者都说真话的情况下,拍卖的结果能导致最大的社会福利,就是说这场拍卖时社会福利最大化(welfare maximizing)。

定理2.4(二价拍卖是理想化的)二价单物品拍卖满足:

1强动机保证-二价拍卖时DSIC的

2高性能保证-社会福利最大化的

3计算高效-二价拍卖可以在输入量(指描述v1,...,vn所需要的比特的数量)的多项式时间内实施

第三章 迈尔森引理

如何设计同时满足DSIC、社会福利最大化和计算高效的拍卖机制。

第一步,假设出价都真实,在此基础上设计分配规则,从而实现社会福利最大化。

第二部,设计一个合适的卖价,从而使真实报价成为一个占优策略。(迈尔森引理可以实现第二步)

3.1 单参数环境

n个智能体,每个智能体i都对单个物品有非负的估值vi(私人信息)。可行集X中的每个元素x都是一个n维向量(x1,x2,...,xn),xi表示智能体i获得的物品数量。

3.2 分配规则和支付规则

二价拍卖 三步:

1收集所有智能体的出价b=(b1,...,bn),将向量b称为出价向量或出价组合。

2分配规则 选择一个可行的分配x(b)∈X,这个分配是出价向量的函数。

3支付规则 选择一个支付p(b)∈Rn,它也是出价向量的函数。

给定智能体出价向量b,在一个分配函数x和支付函数p的机制下,智能体i的收益函数计算:uib=vi·xi(b)-pi(b)

支付规则满足:pi(b)∈[0,bi·xi(b)]

pi(b)≥0保证卖价不倒找钱;pi(b)≤bi·xi(b)保证如实汇报自己真实估值的智能体收益非负。

3.3迈尔森引理内容

定义3.5(可实施的分配规则)对于一个单参数环境,一个分配规则x,如果存在一个支付规则p使得直接显示机制(x,p)是DSIC的,就称之为x可实施。

直接显示机制-机制要求智能体直接地显露其私人估值。

定义3.6(单调分配规则)如果对每个智能体i和和其他智能体的出价向量b-i,对智能体i的分配函数xi(z,b-i)是i的出价z的单调非减函数,称一个分配规则x是单调的。

即在一个单调分配规则下,更高的出价会为你赢得更多物品。

定理3.7(迈尔森引理)在一个单参数环境下:

(a)一个分配规则x是可实施的,当且仅当它是单调的。

(b)如果x是单调的,那么存在唯一的支付规则,使得直接显示机制(x,p)是DSIC的,且使得对于所有报价bi=0均有pi(b)=0.

(c)b中的支付规则有明确的表达式。

3.4迈尔森引理的证明

第四章 算法机制设计

4.1背包拍卖

4.1.1每一个竞拍者i都有一个公开嘚规模wi和一个私有的估值。卖价有容量W。可行集合X是一个0-1向量(x1,...,xn),且\sum_{i=1}^{n}w_{i}x_{i}\leqslant W.(xi=1仍然意味竞拍者i是拍卖中的一个赢家)。

  • 6
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值