第一章:基本概念(博弈论、纳什均衡、维克瑞拍卖、POA、赞助搜索拍卖)

1. 什么是博弈论(Game Theory)?

  • 博弈:指的是理性且智能的决策者或参与人之间的互动
  • 理性(Rationality):在收益得到明确定义的情况下,参与人选择策略(Strategy),以使收益最大
  • 智能(Intelligence):指的是参与人能够计算他们的最优策略

博弈论着眼于是博弈分析机制设计则强调通过博弈设计来实现合意结果。即,设计博弈,若非特别说明,我们把博弈论和机制设计统一简称为:博弈论

2. 什么是纳什均衡?

  • 纳什均衡指的是,在该策略组中,任何参与人都无法通过独自偏离自己的均衡策略而获得更大的收益。

3. 维克瑞拍卖 ( 第 二 价 格 密 封 拍 卖 ) ( 第二价格密封拍卖 ) ()

  • 假设某个卖主打算把一件不可分割的商品卖给 n n n 个潜在买主中的一个,比如,政府打算将某个无线电频谱许可证卖给多个服务商中的一个。每个参与人对出售的东西有一定估值或称评价(valuation)。

  • 例如,在频谱许可证这个例子中假设有四个服务商(服务商1、2、3和4),他们对该许可证的评价分别为4亿元、5亿元、7亿元以及10亿元。在频谱拍卖中,政府邀请潜在买主投标并且根据拍卖协议决定谁中标。

  • 有两种简单而常用的拍卖方法,即第一价格密封拍卖(firstprice sealed bid auct­ion)和第二价格密封拍卖(secondprice sealed bid auction)。

    • 在第一价格密封拍卖中,报价最高的投标人中标他应按照报价付款。
    • 在第二价格密封拍卖中,报价最高的投标人中标,但他仅需要按照第二高的报价付款。
  • 上面的每种拍卖都可以模拟为涉及卖主和买主的博弈。在第一价格密封拍卖中,投标人的报价小于他们对拍卖物的估值,在第二价格密封拍卖中,投标人将更大胆, 因为们知道如果他们中标,他们实际支付的钱数小于自己的报价。

重要结论

  • 威廉·维克瑞{Wil· liam Vickrey)证明在第二价格密封拍卖中,投标人的报价正好等于各自对拍卖物的估值。维克瑞证明每个投标人的最优选择是,不管其他投标人的报价为多少,他都应该如实报价(报价等于他的估值)。
  • 在上面的例子中,如果政府使用第二价格密封拍卖,那么投标人的报价等于各自的估值,服务商 4 4 4 将中标并获得许可证。这个服务商将向政府支付 7 7 7 亿元,注意,这是第二高的报价。因此,在第二价格密封拍卖中,尽管卖者不知道投标人对拍卖物的评价,但他能够通过投标人的报价获得这个信息。当前广泛使用的各种拍卖协议,其背后的科学正是博弈论和机制设计。

4. 无政府状态代价 ( P O A ) (POA) (POA)

  • P O A POA POA 用于衡量自由个体的自私行为对社会最优状态实现的影响程度。

5. 算法机制设计 (Algorith micmechanism design)

  • 算法机制设计(algorithmic mechanism design)。他们指出了博弈论和机制设计如何用于求解算法问题,
  • 在这种情形下,问题的输入数据为理性且智能个体的私人信息。 传统计算机科学假设算法一旦设计好,那么计算机将如 实执行这些算法。
  • 然而,如果在算法执行过程中,自利的参与人被迫提供私人信息, 那么提供给算法的这些信息可能为真也可能为假。算法机制设计的主旨正是使得算 法对策略型个体的人为控制行为是稳健的。
  • 现在,算法博弈论已成为世界很多须要 计算机科学部门的一个活跃的研究领域。 算法博弈论是博弈论诸多研究趋势的一个代表。

6. 赞助搜索拍卖

  • 付费搜索或称赞助搜索(sponsored search)已成为互联网广告领域极其成功的商业模式。当互联网用户搜索关键词时,搜索引擎提供的网页含有成千上万个与关键词相关的链接,也含有与广告相关的赞助链接。
  • 当互联网用户点击了赞助链接时,他们就打开了相关广告客户的网页。 在常见的点击付费(pay-per-click)模式下,广告客户按照它的网页点击量向搜索引擎支付一定费用。
  • 由于互联网用户和关键词都是任意的,搜索引擎面对的问题是将不同广告客户与 (有限的)赞助广告位置进行匹配。另外,搜索引擎也需要确定广告客户对每次点击需要支付的费用。
  • 目前,大多数搜索引擎使用拍卖机制来解决这个问题,这就是所谓的赞助搜索拍卖 (sponsored search auction)。在典型赞助搜索拍卖中,搜索引擎让广告客户报出他们对自己喜欢的关键词的支付意愿,即当互联网用户点击相应赞助广告位置时广告客户愿意支付的政大钱数。这个支付意愿通常称为每次点击费用(cost-per-click)。
  • 根据广告客户对特定关键词的报价,搜索引擎确定:
    • (1)让哪些广告出现;
    • (2) 不同广告出现的顺序;
    • (3) 当客户的广告位置被互联网用户点击时客户需要支付的钱数。
    • 广告客户实际支付的钱数取决于他们的报价。决策(1)、(2)和(3)构成了赞助搜索拍卖机制
  • 搜索引擎通常希望收人最大化,而广告客户希望在给定的预算下实现最大收益。这就构成了博弈,其中搜索引擎和广告客户为博弈参与人。

7. 共同知识(Common knowledge)

  • 共同知识定义为:对于某个事实,如果每个参与人知道该事实每个参与人知道每个参与人知道该事实,如此循环下去,那么该事实就是所有参与人通享的。
  • 在伴随完全信息的策略型博弈 < N , ( S i ) , ( u i ) > <N,(S_i),(u_i)> <N(Si)(ui)>中,集合 N N N、 策略集 S 1 , . . . , S n S_1 , ... , S_n S1,...,Sn. 以及效用函数 u 1 , … , u n u_1, …,u_n u1,un. 都是共同知识,也就是说,每个参与人知道它们,每个参与人知道每个参与人知道它们,如此循环下去。

参考

《博弈论与机制设计》中国人民大学出版社,经济科学译丛

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值