一、基本信息
- 题目:设计带预算的最优机制激励用户生产高质量内容
- 作者:Mengjing Chen,Pingzhong Tang,Zihe Wang,Shenke Xiao,Xiwang Yang
二、文章摘要
- 以下内容取自原文摘要部分:
本文中,我们设计总产量最大化机制用以激励用户在UGC网络中上传高质量内容。我们发现,广泛应用的比例划分机制在最坏情况下可能导致很差的结果。这个问题可以使用一个带有边界和递增变量的线性程序来形式化表示。然后我们提出了一个 O ( n l o g n ) O(nlogn) O(nlogn)的算法来寻找最优机制,其中 n n n代表参与者的数量。 - 文章背景
UGC(user-generated-content)网络依靠用户上传视频,用户既是视频的生产者也是消费者,因此UGC网络的成功与否取决于用户上传视频的质量。然而高质量的视频往往伴随着高成本与高难度,中心设计货币化奖励机制目的最大化用户生产质量,用户参与机制考虑最优响应以最大化个人收益。本文考虑的模型是独立的、异质的,也就是说用户有自己独特的类型(表征生成内容的能力)并且决策不受他人影响。
三、核心模型
- UGC网络中所有代理者的集合是 N = ( 1 , 2 , . . . , n ) N=(1,2,...,n) N=(1,2,...,n),每个代理者都有私人类型 q i ∈ R + q_i\in R^+ qi∈R+(代表所能产生内容质量的最大值),并且我们假设代理者是按照能力从小到大排序的,也就是说 0 < q 1 < = q 2 < = . . . < = q n 0<q_1<=q_2<=...<=q_n 0<q1<=q2<=...<=qn。
- 本文采取的是完全信息设定,也就是说类型组合 ( q 1 , q 2 , . . . , q n ) (q_1,q_2,...,q_n) (q1,q2,...,qn)对网络中所有人是已知的。每个代理者决策产生的质量 0 < = x i < = q i 0<=x_i<=q_i 0<=xi<=qi,对应付出代价 c i = x i C / q i c_i=x_iC/q_i ci=xiC/qi(C是一个正值常量)。
- 奖励函数设置为内容质量到奖励的映射。奖励只基于代理者生产的内容质量,与其他人无关。这种简单且直接的设计有助于用户理解并作出最优响应。结合奖励函数与代价,代理者的效用函数如下:
u i ( x i ) = f ( x i ) − x i C q i u_i(x_i)=f(x_i)-\frac{x_iC}{q_i} ui(xi)=f(xi)−qixiC - 将问题整理为线性规划问题如下。
x
i
∗
x_i^*
xi∗表示代理者
i
i
i作出的最优响应。机制设计者的目的是为了最大化内容质量总和(都是最优响应的情况下)。其中需要满足效用函数约束、激励相容约束(表达式的意思是最优响应,即所有代理者的最优响应与最优机制重合)、预算约束、容量约束、非负约束。
m a x i m i z e ∑ i = 1 n x i ∗ s u b j e c t t o ( u t i l i t y d e f i n i t i o n ) u i ( x i ) = f ( x i ) − x i C q i ( i n c e n t i v e c o n s t r a i n t ) ∀ x ∈ [ 0 , q i ] , u i ( x i ∗ ) > = u i ( x ) , i = 1 , 2 , . . . , n ( b u d g e t c o n s t r a i n t ) ∑ i = 1 n f ( x i ∗ ) < = B ( c a p a b i l i t y c o n s t r a i n t ) 0 < = x i ∗ < = q i , i = 1 , 2 , . . . , n ( n o n − n e g a t i v e r e w a r d ) ∀ x > = 0 , f ( x ) > = 0 maximize \space \sum_{i=1}^nx_i^*\\ subject \space to(utility \space definition) \space u_i(x_i)=f(x_i)-\frac{x_iC}{q_i}\\ (incentive \space constraint) \space \forall x\in [0,q_i],u_i(x_i^*)>=u_i(x),i=1,2,...,n\\ (budget \space constraint) \space \sum_{i=1}^n f(x_i^*)<=B\\ (capability \space constraint) \space 0<=x_i^*<=q_i,i=1,2,...,n\\ (non-negative \space reward)\forall x>=0,f(x)>=0 maximize i=1∑nxi∗subject to(utility definition) ui(xi)=f(xi)−qixiC(incentive constraint) ∀x∈[0,qi],ui(xi∗)>=ui(x),i=1,2,...,n(budget constraint) i=1∑nf(xi∗)<=B(capability constraint) 0<=xi∗<=qi,i=1,2,...,n(non−negative reward)∀x>=0,f(x)>=0 - 比例分配机制:比例分配机制的应用十分广泛,在本文中作为最优机制的对比机制。比例分配机制的核心思想是:根据代理者所创造内容质量 x i x_i xi占总体的比例分配奖励。该机制使得用户的奖励不仅取决于自身的努力,还取决于大环境。后续证明,该机制与最优机制性能差距较大。
u i ( x i , x − i ) = x i B ∑ j = 1 n x j − x i C q i u_i(x_i,x_{-i})=\frac{x_iB}{\sum_{j=1}^nx_j}-\frac{x_iC}{q_i} ui(xi,x−i)=∑j=1nxjxiB−qixiC
四、机制算法
- 上面的优化问题十分复杂,因为优化的对象是一个函数,而函数具有巨大的设计空间。能否基于某种假设,消去奖励函数,最优化策略组合然后对应生成奖励函数? 根据引理1、引理2(具体内容及证明请见原文),原始优化问题可转化为:
m a x m i z e ∑ i = 1 n x i ∗ s u b j e c t t o 0 < = x i ∗ < = q i , 0 < = x 1 ∗ < = x 2 ∗ < = . . . < = x n ∗ , C ( x n ∗ q n + ∑ i = 1 n − 1 ( ( n − i ) ( 1 q i − 1 q i + 1 ) + 1 q i ) x i ∗ ) < = B maxmize \space \sum_{i=1}^{n}x_i^*\\ subject \space to \space 0<=x_i^*<=q_i,\\ 0<=x_1^*<=x_2^*<=...<=x_n^*,\\ C(\frac{x_n^*}{q_n}+\sum_{i=1}^{n-1}((n-i)(\frac{1}{q_i}-\frac{1}{q_{i+1}})+\frac{1}{q_i})x_i^*)<=B maxmize i=1∑nxi∗subject to 0<=xi∗<=qi,0<=x1∗<=x2∗<=...<=xn∗,C(qnxn∗+i=1∑n−1((n−i)(qi1−qi+11)+qi1)xi∗)<=B
为了简化表达,我们这里设定 z i = ( n − i ) ( 1 q i − 1 q i + 1 ) + 1 q i z_i=(n-i)(\frac{1}{q_i}-\frac{1}{q_{i+1}})+\frac{1}{q_i} zi=(n−i)(qi1−qi+11)+qi1,由此可得该优化问题可以简化为如下所示。原始优化问题编号为(2),上面优化问题编号为(5),下面优化问题编号为(1)。设计算法解决(1)的同时(5)也就解决了。
m a x m i z e ∑ i = 1 n x i ∗ s u b j e c t t o 0 < = x i ∗ < = q i , i = 1 , 2 , . . . , n 0 < = x 1 ∗ < = x 2 ∗ < = . . . < = x n ∗ , ∑ i = 1 n z i x i ∗ < = K maxmize \space \sum_{i=1}^{n}x_i^*\\ subject \space to \space 0<=x_i^*<=q_i,i=1,2,...,n\\ 0<=x_1^*<=x_2^*<=...<=x_n^*,\\ \sum_{i=1}^{n}z_ix_i^*<=K maxmize i=1∑nxi∗subject to 0<=xi∗<=qi,i=1,2,...,n0<=x1∗<=x2∗<=...<=xn∗,i=1∑nzixi∗<=K - 基于贪心思想的算法展示如下,左边算法时间复杂度为
O
(
n
2
)
O(n^2)
O(n2),右边算法时间复杂度为
O
(
n
l
o
g
n
)
O(nlogn)
O(nlogn)。(具体算法细节有待进一步研究)