Twenty Lectures on Algorithmic Game Theory 算法博弈论二十讲 Lecture 5 Revenue-Maximizing Auctions (下)

Twenty Lectures on Algorithmic Game Theory 算法博弈论二十讲 Lecture 5 Revenue-Maximizing Auctions (下)

Lecture 5 Revenue-Maximizing Auctions

5.2 Characterization of Optimal DSIC Mechanisms

本讲的主要目标是为每一个单参数环境及其分布 F 1 , … , F n F_1, \dots, F_n F1,,Fn提供一个明确的最优(即期望收益最大化的)DSIC 机制描述。

5.2.1 Preliminaries

我们可以通过应用上一讲中的揭示原理(定理 4.3)来简化问题。由于每一个 DSIC 机制都等价于一个直接揭示的 DSIC 机制 ( x , p ) (x, p) (x,p),因此具有相同的期望收益,我们可以将注意力限制在这样的机制上。接下来,我们假设竞标者如实出价(即 b = v b=v b=v),并在本讲的其余部分基于这一假设进行讨论。

根据定义,DSIC 机制 ( x , p ) (x, p) (x,p)的期望收益为:

E v ∼ F [ ∑ i = 1 n p i ( v ) ] ( 5.1 ) \mathbf{E}_{\mathrm{v} \sim \mathrm{F}}\left[\sum_{i=1}^{n} p_{i}(\mathrm{v})\right] \quad (5.1) EvF[i=1npi(v)](5.1)

其中,期望值是相对于代理人估值分布 F = F 1 × ⋯ × F n F = F_1 \times \cdots \times F_n F=F1××Fn来计算的。直接在 DSIC 机制的空间内最大化表达式 (5.1) 并不容易。接下来,我们将推导出机制期望收益的另一种公式。这种替代公式只涉及机制的分配规则,而不涉及支付规则,因此更容易进行最大化。

5.2.2 Virtual Valuations

5.2.3 Expected Revenue Equals Expected Virtual Welfare

5.2.4 Maximizing Expected Virtual Welfare

5.2.5 Regular Distributions

5.2.6 Optimal Single-Item Auctions

5.3 Case Study: Reserve Prices in Sponsored Search

那么,这些最优机制设计理论究竟是如何应用的呢?本节讨论了 2008 年进行的一项实地实验,探讨了最优拍卖理论的经验教训是否可以用于提高雅虎的赞助搜索收入。

回顾第 2.6 节中我们讨论的赞助搜索拍卖模型。理论上,哪种拍卖能最大化预期收益?假设竞标者的每次点击估值是从一个正则分布 FFF 中独立同分布抽取的,其虚拟估值函数为 ϕ \phi ϕ,那么最优拍卖仅考虑那些出价至少为保留价 ϕ − 1 ( 0 ) \phi^{-1}(0) ϕ1(0)的竞标者,并根据出价对这些竞标者进行排名(从最佳位置到最差位置)。参见练习 5.8。

那么,雅虎在 2008 年之前的做法是什么?首先,他们使用了相对较低的保留价——最初为 0.01 美元,后来提高到 0.05 美元,然后是 0.10 美元。或许更为简单的是,他们对所有关键词使用了相同的 0.10 美元保留价,即使某些关键词显然需要比其他关键词更高的保留价(例如,“离婚律师”与“披萨”)。如果将每个关键词的保留价独立更新为理论上的最优保留价,雅虎的收入会发生怎样的变化呢?在实地实验的第一步中,对大约 50 万个不同关键词的过去竞价数据进行了对数正态估值分布的拟合。实验的定性结论似乎与此步骤的细节无关,例如所选择的估值分布类型。

在第二步中,假设估值是根据拟合的分布进行的,为每个关键词计算了理论上的最优保留价。正如预期的那样,不同关键词的最优保留价差异显著。有许多关键词的理论最优保留价在 0.30 美元或 0.40 美元左右。对于这些关键词来说,雅虎的统一保留价相对于最优拍卖理论提供的建议明显过低。

显而易见的实验是尝试使用理论上的最优(通常更高的)保留价,看看效果如何。然而,雅虎的高层希望采取更保守的做法,于是他们将新保留价设定为旧保留价(0.10 美元)和理论最优保留价的平均值。这一变化奏效了:拍卖收入增长了几个百分点(在一个非常大的基数上)。新保留价在那些市场价值高但竞争不太激烈(少于六个竞标者)的市场中尤其有效。雅虎的总裁将保留价的改进视为 2008 年第三季度雅虎搜索收入增加的主要原因。

The upshot

与最大化福利的机制不同,最大化收益的机制会因环境中的(私有)估值而变化。

在对比不同机制的平均情况或贝叶斯方法中,每个代理的估值都是从机制设计者已知的分布中独立抽取的。最优机制是在这些分布下具有最高预期收益的机制。

DSIC 机制的预期收益可以纯粹用其分配规则来表示,这一表述利用了虚拟估值的关键概念(5.2)。

如果对应的虚拟估值函数是非递减的,则分布是正则的。许多常见的分布都是正则的。

在正则估值分布下,最优机制是虚拟福利最大化机制,它针对每个估值配置选择虚拟福利最大的结果。

在竞标者估值独立同分布且来自正则分布的单一物品拍卖中,最优拍卖是带有保留价的二价拍卖。

2008 年,雅虎通过应用最优机制设计理论,将其赞助搜索收入提高了几个百分点。

  • 23
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值