机制设计-选址/路由游戏

设施选址

模型:

• 玩家:N= \{1,....,n \}

• 每一个玩家都有一个位置:x_i \in R

• 机制:f:R^n \rightarrow R

• 为了表示方便,假设 x_1\leq x_2\leq ...\leq x_n(实际的顺序可能不同)

社会付出:

• 玩家付出:i=|f(\vec{x})-x_i|

• 总付出:\sum_{i\in N}|f(\vec{x})-x_i|

• 最大付出:max_i|f(\vec{x})-x_i|

最小化最大的成本?

  • 最优解:\frac{x_1+x_n}{2}
  • 非真实

中位数机制:

• 选择中位数玩家的位置(如果有两个中位数玩家,向下取整)

• 中位数是:

  • 策略性真实的(= 真实的)
  • 对于总成本目标来说,是社会最优的。

当 x_2 说谎,向左谎报自己的地址到 x_2'。对于中位数机制没有影响。

当 x_2 说谎,向右谎报自己的地址到 x_2'。中位数会向右移动,导致 x_2 收益降低。

谎报对于社会总支出增加:

当设施更新到右侧位置x_2'x_1x_2x_3支出增加,x_4x_5 支出减少

• (当 n 为偶数时)中位数是:

  • 具有策略真实性
  • 对于总成本目标来说,是社会最优的。

选择最左侧代理的位置:

  • 具有策略真实性
  • 最大成本的近似比率是多少? 

定理:任何确定性的真实机制对于最大成本都具有至少的最坏情况近似比率。

Approximation \,\, Ratio =\frac{Cost\,\,of \, \,mechanism}{Optimal \\Cost}

证明: 假设矛盾,存在一个确定性真实机制 f,其最大成本的近似比率 < 2。

考虑位于0和1的两个代理。假设f(\vec{x})=t 对于一些 0< t <1。

假设接下来玩家2的真实位置是 t。为了保持最大成本比率优于2,机制的输出必须严格在两位玩家之间。 但那么,玩家2通过谎报自己的位置在1可能会受益。因为假设机制是真实的,但是玩家2有说谎的动机,所以假设是错误的。

随机机制:

  • 以概率 \frac{1}{4} 选择 x_1
  • 以概率 \frac{1}{4} 选择 x_n
  • 以概率 \frac{1}{2} 选择 \frac{x_1+x_n}{2}

 

对于x_1 和 x_n 假设距离为 d,最优为 \frac{d}{2}

在机制中:\frac{1}{4}\cdot d+\frac{1}{4}\cdot d+\frac{1}{2}\cdot \frac{d}{2}=\frac{3d}{4}

比率为\frac{3d}{4}/\frac{d}{2}=\frac{3}{2}

这个机制是策略真实的!

证明:为了让机制改变任何事情,要么最左边的点(x_1)要被改变,要么最右边的点(x_n)必须被改变。

最左边的玩家有动机不真实地报告吗? 

如果玩家向左误报了距离:d

• 从x_1' 向左移动的成本 = \frac{1}{4}\cdot d

• 从\frac{x_1'+x_n}{2}向左移动的好处 = \frac{1}{2}\cdot \frac{d}{2}=\frac{d}{4}

因此,最左边的玩家没有动机不真实地报告!

同样,最右边的玩家没有动机不真实地报告。

任何其他玩家想要改变结果都必须移动到 x_1 的左边或 x_n 的右边。

但通过类似的计算,这样做是没有好处的。

定理:任何随机策略真实机制的最大成本近似比率至少为 \frac{3}{2}

路由游戏

Pigou的例子:

需要将一单位的交通从s 路由到 t 

  1. 上流的路线,不论有多少车辆经过,其出行时间都是固定的,即c(x) = 1。
  2. 下流的路线,其出行时间是与经过的车辆数x成正比的,即c(x) = x。

•  现在,假设有1单位的交通需要从S路由到T。

  1. 如果所有的交通都选择上流,那么每个车辆的出行时间都是1。
  2. 如果所有的交通都选择下流,那么每个车辆的出行时间都是1(因为交通量x=1)。
  3. 如果交通被均匀分配到两条路线上,那么上流的出行时间是1,而下流的出行时间是0.5(因为交通量x=0.5)。

•  现在,假设有x单位的交通需要从S路由到T。走c(x) = x的流量为x,走c(x) = 1的流量为1.

  1. c(x) = x: 流量为x,每个人所需的时间为x。总支出为 x^2
  2. c(x) = 1:流量为1-x,每个人所需的时间为1。总支出为 (1-x )
  3. 所有人总支出为 

x^2+(1-x)=x^2-x+1\\ (x^2-x+1)'=2x-1=0,\ x=\frac{1}{2} \\ x^2+(1-x)=\frac{3}{4}

布雷斯驳论

关键洞察:自私行为损害社会福利

• 失序的代价(Price of Anarchy):在最糟糕的纳什均衡下的社会成本与社会最优解之间的比率。

PoA(G)=\frac{WorstNash(G)}{OPT(G)}

在非原子路由游戏中,所有均衡流都有相同的成本,所以我们可以在上述的分子中取任何均衡值。

对于Pigou例子:

  • 最优支出是(OPT)= 3/4
  • 纳什均衡支出 (EQ)= 1
  • 失序的代价 (POA)= 1\ (3\4) = 4/3

对于布雷斯驳论:

  • 最优支出是(OPT)= 3/2
  • 纳什均衡支出 (EQ)= 2
  • 失序的代价 (POA)= 2\ (3\2) = 4/3

路由游戏:原子版本

• 交通单位数为 k ,其中 k 是一个正整数。

• 每个单位必须作为一个整体被路由(我们可以将每个单位视为一个玩家)。

• 每条边 e\in E 都有一个成本函数 c_e:N\rightarrow R_{\geq 0}

原子路由游戏:

需要将两个交通单位从 s 路由到 t

两个纳什均衡:

1. 两个玩家都选择上流路线:

  • 当两者都选择上流路线时,他们都需要2个时间单位。
  • 如果玩家1更改其选择为下流路线,他只需要1个时间单位,而玩家2仍然需要2个时间单位。
  • 结论:玩家1有动机更改其选择,因为他可以减少所需的时间。因此,这不是纳什均衡。

2. 两个玩家都选择下流路线:

  • 当两者都选择下流路线时,他们都需要2个时间单位。
  • 如果玩家1更改其选择为上流路线,他仍然需要2个时间单位。
  • 结论:玩家1没有动机更改其选择,因为更改不会减少所需的时间。因此,这是纳什均衡。

3. 玩家1选择上流路线,玩家2选择下流路线:

  • 在这种情况下,玩家1需要2个时间单位,而玩家2只需要1个时间单位。
  • 如果玩家1更改其选择为下流路线,那么两个玩家都需要2个时间单位。
  • 结论:玩家1没有动机更改其选择,因为更改不会减少所需的时间。因此,这也是纳什均衡。

原子和非原子路由游戏区别

1. 原子路由游戏 (Atomic Routing Games):

  • 在原子路由游戏中,每个玩家的选择都会对系统产生显著的影响。
  • 玩家数量是有限的,且每个玩家都有自己的策略和偏好。
  • 由于玩家数量有限,他们的决策会对其他玩家产生直接的影响,导致策略互动和可能的多个均衡。
  • 原子路由游戏通常使用纳什均衡来描述玩家的策略选择。

2. 非原子路由游戏 (Non-atomic Routing Games):

  • 在非原子路由游戏中,每个玩家的影响都是微不足道的,因此他们的决策不会对系统产生显著的影响。
  • 玩家数量是无限的或非常大,例如大量的车辆或数据包。
  • 由于每个玩家的影响都很小,他们通常被视为一个连续的流,而不是离散的实体。
  • 非原子路由游戏通常使用Wardrop均衡来描述玩家的策略选择。在Wardrop均衡中,所有使用的路线的出行时间都是相同的,并且没有未使用的路线的出行时间比这些路线短。

路由游戏:均衡

定理:在原子路由游戏中,总是存在一个纯纳什均衡流。

  •  高层思想:证明每一个原子路由游戏都是一个势函数游戏。
  •  所有玩家无意中并集体地努力优化一个势函数。

势函数:\Phi (f)= \sum_{e \in E} \sum_{i=1}^{f_e} c_e(i)

  1. 边的集合 E: 这代表了网络中的所有边或路线。

  2. 流量 f_e​ : 对于每条边 ef_e​ 代表了选择这条边的流量数量或车辆数量。

  3. 成本函数 c_e(i) : 这是一个函数,表示第 i 个流量单位(例如车辆)在边 e 上的成本或延迟。这个成本可能会随着流量的增加而增加,因为更多的车辆可能会导致更大的拥堵。

  4. 外部的求和: \sum_{e \in E}​ 遍历网络中的所有边。

  5. 内部的求和: \sum_{i=1}^{f_e} c_e(i) 对每条边 e 上的每个流量单位计算成本。

结论:整个函数 \Phi (f) 计算了网络中所有边上的所有流量单位的总成本或总延迟。

纳什均衡:没有玩家能够通过改变其策略来单独减少自己的成本,同时不增加势函数的值。

关键性质:如果一个玩家从一条路径 P 偏离到另一条路径 \hat{P},势函数的变化是

\Phi (\hat f)-\Phi (f)= \sum_{e \in \hat P} c_e(\hat f_e)-\sum_{e \in P} c_e(f_e)

  1. 势函数的差异\Phi (\hat f)-\Phi (f) 表示在流量分配策略 \hat ff 之间的势函数值的差异。这个差异捕获了两种策略在总成本或总延迟上的差异。

  2. 路径集合 \hat{P}P:这两个集合分别代表与流量分配策略 \hat ff 相关的路线或路径。在路由游戏中,玩家(例如车辆或数据包)可以选择不同的路径从起点到达终点。

  3. 成本的总和

  • \sum_{e \in \hat P} c_e(\hat f_e):这是流量分配策略 \hat f 下所有路径的总成本或总延迟。
  • \sum_{e \in P} c_e(f_e):这是流量分配策略 f下所有路径的总成本或总延迟。

因此,等式的右侧表示两种流量分配策略在总成本或总延迟上的差异。

换句话说,当一个玩家偏离时,势函数的变化与偏离者的个体成本的变化是相同的!

因此,最小化势函数的流动是一个均衡。

• 类似的证明也适用于非原子路由游戏。

• 使用积分代替成本函数上的求和。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值