1. 论文综述
这是一篇关于群智平台激励机制的论文(定位),主要提出了一种比较详细的激励机制算法。传统激励机制主要分为报酬支付激励、娱乐游戏激励、社交关系激励、虚拟积分激励。其中,报酬支付机制主要采用博弈论思想,用的比较多的是拍卖模型。文章中提出的算法主要基于双向拍卖模型(平台发布多个任务,有多个申请者,每个申请者可以申请多个任务),把激励过程分为三个阶段:选择参与者阶段、调整平台花费阶段以及参与者额外奖励阶段、评估感知结果和计算参与者实际奖励并更新参与者能力阶段。文章中为每个阶段设计了一个详细的算法。文章中提出的群智平台激励机制算法模型如下。
2. 详细介绍
1. 选择参与者阶段
文章中该阶段采用Participant decision alogrithm(PDA)算法来从申请者中选出合适的参与者来完成感知任务。下面是一些符号定义。
PDA算法的伪代码如下。
其中L是算法执行的轮数;TL是算法执行L-1轮后的任务集合;RL是算法执行L-1轮后申请者提交的申请数据集合。算法中涉及的计算公式以及说明如下。
第一个方框框出来的部分剔除申请列表中执行能力小于零的申请(第三部分会介绍更新申请者能力的算法);算法执行的每一轮,第二个方框框出来的部分计算申请者平均竞标价格;算法中涉及的一个函数arg minJq(L)的意思是当Jq(L)取最小值是q的取值;第三个方框框出来的部分根据文中定义的参与者决定因素来挑选申请者,文章中定义的参与者选择因素类似于性价比(文中定义是性价比倒数,故每次选择最小的),加一个参数W可以在后续流程中动态调整选择的参与者来控制平台花费。
所以,总的来说,这部分就是从申请者中选出性价比较高的申请者来执行感知任务。
2. 调整平台花费阶段以及参与者额外奖励阶段
该阶段采用Budget balancing and extra rewards alogrithm(BBER)算法来实现。下面是算法中使用到的一些符号定义。
BBER算法的伪代码如下。
BBER算法主要有两部分:(1)确认平台是否会有剩余钱;(2)计算额外奖励。其中涉及的一些公式以及公式说明如下。
如果σ>0,那么按照第一步的选择平台预算是够的,就可以通知第一步选出的参与者最新奖励数额且可以开始感知任务了。
如果出现σ<=0的情况,即平台预算不足,可以采取三种做法:调节平台预算;调节参数W(至于为什么,文章后面有模拟实验说明,其实也挺好理解);重新发布任务。
3. 评估感知结果和计算参与者实际奖励阶段
参与者提交感知任务后,平台对感知结果进行评判并更新参与者能力数值。该阶段采用Evaluate algorithm(EA)算法来实现。下面是该算法的一些符号定义。
该算法认为出现次数超过50%的答案即为正确答案,如果一个任务中没有数目超过50%的答案,即认为任务该任务失败。EA算法的伪代码如下。
该算法主要分为两部分:(1)计算每个任务的完成情况,可信度>0.5的情况下认为任务成功,出现次数最多的答案认定为正确答案。否者,所有参与者都算任务失败。(2)计算每个参与者最终得到的报酬并更新参与者的能力值。其中涉及的公式及说明如下。
这部分算法在我看来其实存在一些不足,如正确答案的认定这块以及如果一个任务中没有数目超过50%的答案,即认为任务该任务失败。
3. 模拟实验
1. 总体实验
从实验可以看出随着w逐渐增大,参与者平均执行能力和平均竞标出价逐渐降低。
2. 细致
下面是模拟50个任务,1000个参与者时。可以看出随着W变大选出的参与者慢慢向左边,左下发展。也就是说逐渐出现了选择能力值低,竞标价格也低的申请者来完成感知任务。
文章中还进行了与传统算法的对比实验,但并没写清楚传统算法指的是哪个具体算法。
4. 参考文献
Nan Jiang, Dong Xu, Jie Zhou, Hongyang Yan, Tao Wan, Jiaqi Zheng,Toward optimal participant decisions with voting-based incentive model for crowd sensing,
Information Sciences,Volume 512,2020,Pages 1-17,ISSN 0020-0255,https://doi.org/10.1016/j.ins.2019.09.068.
(https://www.sciencedirect.com/science/article/pii/S0020025519309156)