Twenty Lectures on Algorithmic Game Theory 算法博弈论二十讲 Lecture 2 Mechanism Design Basics

Twenty Lectures on Algorithmic Game Theory 算法博弈论二十讲 Lecture 2 Mechanism Design Basics

过去的 15 年里,计算机科学与经济学之间进行了活跃的互动,催生了算法博弈论这一新兴领域。许多现代计算机科学中的核心问题,从大规模网络中的资源分配到在线广告,都涉及多个自利方之间的相互作用。经济学和博弈论提供了许多有用的模型和定义来思考这些问题。而且,思想的交流也是双向的,计算机科学中的概念在经济学中的重要性也在不断增加。

本书源于作者在斯坦福大学开设的算法博弈论课程,旨在为学生和其他新入门者提供一个快速而易懂的介绍,涵盖了该领域中许多最重要的概念。书中还包括在线广告、无线频谱拍卖、肾脏交换和网络管理的案例研究。

蒂姆·拉夫加登(Tim Roughgarden)是斯坦福大学计算机科学的副教授。由于他在算法博弈论方面的研究,他获得了 ACM Grace Murray Hopper 奖、科学与工程师总统早期职业奖(PECASE)、卡莱奖(Kalai Prize)以及社会选择与福利奖、数学规划协会的塔克奖(Tucker Prize)和 EATCS-SIGACT 的哥德尔奖(Gödel Prize)。他撰写了《自私路由与无序代价》(2005)一书,并合编了《算法博弈论》(2007)一书。

Lecture 2 Mechanism Design Basics

从本讲开始,我们正式研究机制设计,即规则制定的科学。本讲介绍了一个重要且经典的机制设计问题——单物品拍卖的设计,并在这一相对简单的环境中开发了一些机制设计的基础知识。后续的讲座将把学到的知识扩展到更复杂的应用中。

第 2.1 节定义了单物品拍卖的模型,包括投标人的拟线性效用模型。第 2.2 节快速形式化了密封竞价拍卖,第 2.3 节提到了第一价格拍卖,而在第 2.4 节中,我们介绍了第二价格(也称为维克里)拍卖,并确立了它们的基本性质。第 2.5 节正式化了我们对拍卖的期望:强激励保证、强性能保证和计算效率。第 2.6 节介绍了一个关于赞助搜索拍卖的案例研究,这是一种用于在线广告销售的“杀手级应用”。

2.1 Single-Item Auctions

考虑一个卖家拥有一件物品,比如一部稍微过时的智能手机。这就是典型 eBay 拍卖的设置。在这种情况下,有一些潜在的投标人(策略性投标人)对购买这件物品感兴趣。

我们希望分析投标人在各种拍卖形式中的行为。为此,我们需要一个模型来描述投标人的需求。第一个关键假设是,每个投标人 i i i都有一个非负的估值 v i v_i vi,即他们对所售物品的最高支付意愿。因此,投标人 i i i希望以尽可能低的价格获得该物品,前提是售价不超过 v i v_i vi。另一个重要的假设是,这一估值是私有的,即卖家和其他投标人都不知道这个估值。

我们的投标人效用模型,称为拟线性效用模型,具体如下。如果投标人 i i i在拍卖中失败,她的效用为 0。如果投标人以价格 p p p获胜,她的效用为 v i − p v_i - p vip。这可以说是最简单且自然的效用模型,也是我们在这些讲座中关注的模型。

2.2 Sealed-Bid Auctions

大多数情况下,我们关注一个简单的拍卖形式类别:密封竞价拍卖。其过程如下:

  1. 每个投标人 i i i私下向卖家提交一个出价 b i b_i bi——你可以想象成在一个密封的信封中提交。
  2. 卖家决定谁获得物品(如果有人获得的话)。
  3. 卖家决定销售价格。

在第二步中,有一个显而易见的实现方式——将物品给出价最高的投标人。这是我们在本讲中考虑的唯一选择规则。

实现第三步的方法有多种合理选择,而这种选择会显著影响投标人的行为。例如,假设我们试图采取利他的做法,对获胜的投标人不收取任何费用。这种想法会严重适得其反,导致拍卖变成一个“谁能报出最高数字”的游戏。

2.3 First-Price Auctions

在第一价格拍卖中,获胜的投标人支付其出价。这类拍卖在实际中很常见。

第一价格拍卖很难进行推理。首先,作为参与者,难以确定如何出价。其次,作为卖家或拍卖设计者,也难以预测会发生什么。为了更好地说明这一点,想象一下你正在参与以下的第一价格拍卖。你对所售物品的估值(以美元计算)是你的出生月份加上你出生日期的数字。因此,你的估值介于 2(1 月 1 日)到 43(12 月 31 日)之间。假设有一个其他竞标者(从世界范围内随机选择),其估值方式与您相同。你会提交什么样的出价以最大化你的期望效用?知道对手的生日会有帮助吗?如果你知道拍卖中有两个其他投标人而不是一个,你的答案会改变吗?

2.4 Second-Price Auctions and Dominant Strategies

现在我们将重点放在另一种单物品拍卖形式上,这种拍卖在实际中也很常见,而且更容易推理。当你赢得 eBay 拍卖时会发生什么?如果你出价 100 美元并获胜,你真的会支付 100 美元吗?不一定:eBay 使用一种“代理出价”机制,它会在你的最大出价达到之前,或者在你成为最高出价者之前(以先到者为准),代表你逐步提高出价。例如,如果其他最高出价只有 90 美元,那么你只需支付 90 美元(加上一小部分增量),而不是你最大出价的 100 美元。当你赢得 eBay 拍卖时,成交价格本质上是其他出价中最高的那个——即第二高的整体出价。

第二价格拍卖或维克里拍卖是一种密封竞价拍卖,在这种拍卖中,最高出价者获胜,并支付等于第二高出价的价格。为了说明第二价格拍卖最重要的性质,我们定义了一个支配策略(dominant strategy),即一种保证最大化投标人效用的策略(即出价),无论其他投标人怎么做。

命题 2.1(第二价格拍卖中的激励):在第二价格拍卖中,每个投标人 i i i的支配策略是将其出价 b i b_i bi设置为其私人估值 v i v_i vi

命题 2.1 表明,参与第二价格拍卖特别容易。在选择出价时,投标人不需要考虑其他投标人的任何情况——无论有多少人参与,他们的估值是多少,他们是否如实出价,等等。这与第一价格拍卖完全不同,在第一价格拍卖中,将出价设置为自身估值从来不是一个合理的策略——这会保证零效用,而最佳的低报出价依赖于其他投标人的出价。

命题 2.1 的证明:固定一个任意的投标人 i i i、估值 v i v_i vi和其他投标人的出价 b − i \boldsymbol b_{-i} bi。这里 b − i \boldsymbol b_{-i} bi表示出价向量 b \boldsymbol b b,但去除了第 i i i个分量。我们需要证明,当 b i = v i b_i=v_i bi=vi时,投标人 i i i的效用被最大化。

令$B= \max_{j\neq i} b_j 表示其他投标人中的最高出价。第二价格拍卖的特殊之处在于,尽管 表示其他投标人中的最高出价。第二价格拍卖的特殊之处在于,尽管 表示其他投标人中的最高出价。第二价格拍卖的特殊之处在于,尽管i 可以提出无数个不同的出价,但只有两种截然不同的结果。如果 可以提出无数个不同的出价,但只有两种截然不同的结果。如果 可以提出无数个不同的出价,但只有两种截然不同的结果。如果b_i < B ,则 ,则 ,则i 失败且获得效用 0 。如果 失败且获得效用 0。如果 失败且获得效用0。如果b_i \geq B ,则 ,则 ,则i 以价格 以价格 以价格B 获胜,并获得效用 获胜,并获得效用 获胜,并获得效用v_i - B$。

我们通过考虑两种情况来结束证明。首先,如果 v i < B v_i < B vi<B,投标人 i i i可以获得的最大效用为 max ⁡ { 0 , v i − B } = 0 \max\{0, v_i - B\} = 0 max{0,viB}=0,并且通过如实出价(并失败)来实现这一点。其次,如果 v i ≥ B v_i \geq B viB,投标人 i i i可以获得的最大效用为 max ⁡ { 0 , v i − B } = v i − B \max\{0, v_i - B\} = v_i - B max{0,viB}=viB,并且通过如实出价(并获胜)来实现这一点。

另一个重要的性质是,如实出价的投标人——即出价等于其真实估值的投标人——在第二价格拍卖中永远不会后悔参与。

命题 2.2(非负效用):在第二价格拍卖中,每个如实出价的投标人都保证获得非负效用。

证明:失败的投标人获得效用 0。如果投标人 i i i获胜,则其效用为 v i − B v_i - B viB,其中 B B B是第二高的出价。由于 i i i是获胜者(因此是最高出价者)并且出价等于其真实估值,因此 B ≤ v i B \leq v_i Bvi,从而 v i − B ≥ 0 v_i - B \geq 0 viB0

2.5 Ideal Auctions

第二价格单物品拍卖在某种意义上是“理想的”,因为它们具备三种截然不同且令人向往的性质。我们通过以下定义来形式化其中的第一个性质。

定义 2.3(支配策略激励兼容性):如果对每个投标人来说,如实出价总是支配策略,并且如实出价的投标人总是获得非负效用,那么拍卖就具有支配策略激励兼容性(dominant-strategy incentive compatible, DSIC)。

定义单物品拍卖结果的社会福利为$ \sum_{i=1}^{n} v_i x_i ,其中如果投标人 ,其中如果投标人 ,其中如果投标人i 获胜则 获胜则 获胜则x_i = 1 ,如果失败则 ,如果失败则 ,如果失败则x_i = 0 。由于只有一个物品,我们有可行性约束 。由于只有一个物品,我们有可行性约束 。由于只有一个物品,我们有可行性约束\sum_{i=1}^{n} x_i \leq 1$。因此,社会福利只是获胜者的估值,如果没有获胜者则为 0。如果在出价真实的情况下,拍卖结果具有最大可能的社会福利,那么该拍卖就是福利最大化的。

接下来的定理是由命题 2.1、命题 2.2 以及第二价格拍卖的定义推导而来的。

定理 2.4(第二价格拍卖是理想的):第二价格单物品拍卖满足以下条件:

  1. [强激励保证] 它是一个支配策略激励兼容(DSIC)的拍卖。
  2. [强性能保证] 它是福利最大化的。
  3. [计算效率] 它可以在输入大小的多项式时间内实现(实际上是线性时间),即表示数字 v 1 , … , v n v_1, \ldots, v_n v1,,vn所需的比特数。

这三个性质都非常重要。从投标人的角度来看,DSIC 性质使得选择出价特别容易,并使得经验丰富和不太经验丰富的投标人之间的竞争更加公平。从卖家或拍卖设计者的角度来看,DSIC 性质使得推理拍卖结果更加简单。需要注意的是,任何对拍卖结果的预测都必须基于对投标人行为的假设。在 DSIC 拍卖中,唯一的假设是投标人将采用显而易见的支配策略。行为假设几乎不会比这更弱了。

DSIC 性质在可行时是很好的,但我们还想要更多。例如,一个将物品免费赠送给随机投标人的拍卖虽然是 DSIC 的,但它并没有努力识别哪些投标人真正想要这个物品。福利最大化性质揭示了一件相当惊人的事情:尽管投标人的估值在拍卖前对卖家来说是未知的,但拍卖仍然能够识别出具有最高估值的投标人!(前提是出价如实,这是基于 DSIC 性质的合理假设)。也就是说,第二价格拍卖在解决社会福利最大化问题上表现得和事先知道所有投标人估值一样好。

计算效率很重要,因为为了具有潜在的实际效用,拍卖应在合理的时间内完成。例如,像第 2.6 节中提到的在线广告拍卖,通常需要实时运行。

第 2.6 节以及第 3–4 讲努力在比单物品拍卖更复杂的应用中,追求理想拍卖(如定理 2.4 所述的那样)。

2.6 Case Study: Sponsored Search Auctions

2.6.1 Background

一个网页搜索结果页面由一系列有机搜索结果组成——这些结果是通过像 PageRank 这样的算法被认为与您的查询相关的——以及一系列赞助链接,这些链接是由广告商支付费用的。(现在去做一个网页搜索,最好是使用“抵押贷款”或“律师”这样的有价值关键词,以此来提醒自己。)每次你在搜索引擎中输入一个查询时,都会实时运行一次拍卖,以决定显示哪些广告商的链接、这些链接在页面上的视觉排列方式以及广告商需要支付的费用。无法夸大这种赞助搜索拍卖对互联网经济的重要性。这里有一个令人瞠目结舌的统计数据:大约在 2006 年,赞助搜索拍卖产生了谷歌大约 98% 的收入。虽然现在在线广告以许多不同的方式出售,但赞助搜索拍卖仍然每年创造数百亿美元的收入。

2.6.2 The Basic Model of Sponsored Search Auctions

接下来我们讨论一个简单但有用且具有影响力的赞助搜索拍卖模型。出售的物品是搜索结果页面上的 k k k个赞助链接的“插槽”。投标人是对所搜索的关键词有固定出价的广告商。例如,沃尔沃和斯巴鲁可能是“旅行车”关键词的投标人,而尼康和佳能可能是“相机”关键词的投标人。这类拍卖在两个方面比单物品拍卖更为复杂。首先,通常有多个物品出售(即 k > 1 k>1 k>1)。其次,这些物品并非相同。例如,如果广告以有序列表的形式显示,那么列表中较高位置的插槽比较低位置的更有价值,因为人们通常从上到下浏览列表。

我们使用点击率(click-through rates, CTR)来量化不同插槽之间的差异。插槽 j j j的点击率 α j \alpha_j αj代表最终用户点击该插槽的概率。按照从上到下的顺序排列插槽,我们做出合理的假设,即 α 1 ≥ α 2 ≥ ⋯ ≥ α k \alpha_1 \geq \alpha_2 \geq \cdots \geq \alpha_k α1α2αk。为简化起见,我们还做出一个不合理的假设,即插槽的点击率与其占据者无关。我们关于赞助搜索拍卖的所有讨论都可以扩展到更通用且更现实的模型中,在该模型中,每个广告商 i i i都有一个“质量得分” β i \beta_i βi(越高越好),并且广告商 i i i在插槽 j j j的点击率是 β i α j \beta_i \alpha_j βiαj的乘积(例如,练习 3.4)。

我们假设广告商对展示本身(即在页面上显示)不感兴趣,而是对每次点击其链接有一个私人估值 v i v_i vi。因此,广告商 i i i从插槽 j j j获得的预期价值是 v i α j v_i \alpha_j viαj

2.6.3 What We Want

有没有理想的赞助搜索拍卖呢?我们的理想条件是:

  1. 支配策略激励兼容性 (DSIC):也就是说,如实出价应该是一个支配策略,且永远不会导致负效用。
  2. 社会福利最大化:即投标人到插槽的分配应该最大化 ∑ i = 1 n v i x i \sum_{i=1}^{n} v_i x_i i=1nvixi,其中 x i x_i xi现在表示分配给 i i i的插槽的点击率(如果 i i i未分配到插槽,则为 0)。每个插槽只能分配给一个投标人,每个投标人只能得到一个插槽。
  3. 计算效率:运行时间应该在输入大小 v 1 , … , v n v_1, \ldots, v_n v1,,vn的多项式时间内(甚至接近线性时间)。要记住,每天需要运行成千上万次这样的拍卖!

2.6.4 Our Design Approach

拍卖设计问题的难点在于,我们必须同时设计两件事:谁赢得什么的选择,以及谁支付什么的选择。即使是在单一物品拍卖中,仅仅在第一个设计决策上做出“正确”的选择(例如,将物品给出价最高的人)是不够的——如果支付方式不恰当,战略参与者就会利用系统的漏洞。

幸运的是,在许多应用中,包括赞助搜索拍卖,我们可以一步一步地解决这个双重设计问题。

步骤 1:假设投标者如实出价(虽然没有正当理由)。那么,我们应该如何分配投标者到插槽,以确保上述的属性(2)和(3)得到满足?

步骤 2:在我们得到步骤 1 的答案后,如何设置销售价格以确保上述属性(1)得到满足?

如果我们有效地解决了这两个问题,那么我们就构建了一个理想的拍卖。步骤 2 确保了支配策略激励兼容性 (DSIC) 属性,这意味着投标者会如实出价(假设每个投标者采用显而易见的支配策略)。因此,步骤 1 的假设成立,拍卖的结果确实是社会福利最大化的(并且可以在多项式时间内计算出来)。

我们通过执行赞助搜索拍卖的步骤 1 来结束这节课。

在如实出价的情况下,我们应该如何分配投标者到插槽,以最大化社会福利?练习 2.8 要求你证明自然贪婪算法是最优的(并且计算效率高):对于 i = 1 , 2 , … , k i = 1, 2, \dots, k i=1,2,,k将第 i i i高的投标者分配到第 i i i好的插槽。

我们能执行步骤 2 吗?是否有类似于二价规则的销售价格,使得如实出价成为每个投标者的支配策略?下一讲将通过迈尔森引理给出肯定的答案,这是机制设计中的一个强大工具。

The upshot

在单一物品拍卖中,有一个卖家拥有一个物品,以及多个拥有私密估价的竞标者。单一物品拍卖设计是机制设计中的一个简单但经典的例子。

拍卖是支配策略激励兼容性 (DSIC) 的,如果如实出价是一个支配策略,并且如实出价的竞标者总能获得非负效用。

拍卖是福利最大化的,如果在假设如实出价的情况下,拍卖结果总是能实现最大可能的社会福利。

二价拍卖是“理想的”,因为它们是支配策略激励兼容性 (DSIC) 的,福利最大化的,并且可以在多项式时间内实现。

赞助搜索拍卖是互联网经济的一个巨大组成部分。这类拍卖比单一物品拍卖更复杂,因为有多个插槽供出售,而且这些插槽的质量各不相同。

设计理想拍卖的一般两步法是首先假设如实出价,并了解如何分配物品以最大化社会福利;其次是设计销售价格,使得如实出价成为一个支配策略。

  • 12
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值