2017年国赛高教杯数学建模
B题 拍照赚钱的任务定价
“拍照赚钱”是移动互联网下的一种自助式服务模式。用户下载APP,注册成为APP的会员,然后从APP上领取需要拍照的任务(比如上超市去检查某种商品的上架情况),赚取APP对任务所标定的酬金。这种基于移动互联网的自助式劳务众包平台,为企业提供各种商业检查和信息搜集,相比传统的市场调查方式可以大大节省调查成本,而且有效地保证了调查数据真实性,缩短了调查的周期。因此APP成为该平台运行的核心,而APP中的任务定价又是其核心要素。如果定价不合理,有的任务就会无人问津,而导致商品检查的失败。
附件一是一个已结束项目的任务数据,包含了每个任务的位置、定价和完成情况(“1”表示完成,“0”表示未完成);附件二是会员信息数据,包含了会员的位置、信誉值、参考其信誉给出的任务开始预订时间和预订限额,原则上会员信誉越高,越优先开始挑选任务,其配额也就越大(任务分配时实际上是根据预订限额所占比例进行配发);附件三是一个新的检查项目任务数据,只有任务的位置信息。请完成下面的问题:
1. 研究附件一中项目的任务定价规律,分析任务未完成的原因。
2. 为附件一中的项目设计新的任务定价方案,并和原方案进行比较。
3. 实际情况下,多个任务可能因为位置比较集中,导致用户会争相选择,一种考虑是将这些任务联合在一起打包发布。在这种考虑下,如何修改前面的定价模型,对最终的任务完成情况又有什么影响?
4. 对附件三中的新项目给出你的任务定价方案,并评价该方案的实施效果。
附件一:已结束项目任务数据
附件二:会员信息数据
附件三:新项目任务数据
整体求解过程概述(摘要)
在“拍照赚钱”的新自助式服务模式下,用户可领取app上的任务,成功执行便可赚取标定的酬金。在这种模式下,如何合理定价从而获取最高收益成为了系统运营的核心。本文针对题中所给的数据信息进行数据挖掘,设计了一套较为合理的定价及任务打包算法。
问题一中,我们首先猜测了可能影响任务定价的因素,包括:任务周围的用户限额总量、任务周围的用户密度、任务的离群程度等。我们量化以上可能的影响因素,并以该因素为自变量以定价为因变量回归分析,通过拟合度来判断该因素是否对定价有决定作用。我们随机抽取70%的数据进行回归训练,结果表明,任务的定价与周围用户的限额总量、周围用户的平均距离、自身的离群程度关系密切。利用剩余的30%数据分别对以上回归方程进行检验,用均方残差偏移程度来评价方程的可靠性。根据三个因素,对于成功执行的任务与未成功执行的任务分别进行回归分析,并对比其回归函数图像,发现任务未完成的主要原因是用户没考虑自身限额对定价的影响,其余两个因素相对次要。
问题二中,我们建立了多目标优化模型,其中目标函数为总定价和成功率。对问题一中的完成与未完成的任务,我们可以分别拟合出其定价曲面,位于这两个曲面之间的区间即为合理定价区间。除了问题一中三个因素外,任务成功率还受到周围用户的信誉、预订任务时间等变量的影响。根据已有的数据回归分析,得到成功率的综合评价函数。基于合理定价区间的约束,我们分别对定价最优方案与成功率最优方案进行求解,经过我们的算法优化之后,与原方案相比,我们可以在同样的平均成功率的前提下将定价总额降低2.9%;我们也可以用同样的定价总额将平均成功率提高9.4%。
问题三中,我们建立基于改进的DBSCAN算法的打包方案。确定打包的核心目的是改善预期成功率较小任务的执行情况。我们引入了任务的得分半径和用户得分半径两个参数对原算法中的固定半径进行改进。任务的预期成功率越小,任务得分半径越大,用户的信誉度越高、预订任务时间越早,用户得分半径越大。打包后我们还基于用户得分半径检验打包是否合理,即是否有用户能够执行该任务。基于该算法,我们一共求得62个需要被打包的任务点,被打包成25组。将预期成功率与原成功率进行对比,成功率最高提升了7.2%,平均成功率提升2.3%,验证了任务联合打包对于平均成功率的提升有很大作用。在确定新的定价模型时,我们将定价划分为两大因素:任务本身价值与路途花费。根据原数据对这两个因素的系数进行求解,我们基于该定价函数对定价进行修改,得到了新的定价方案。
问题四中,我们根据优化模型以及打包算法对新数据进行定价、打包、成功率计算,并得到优化的定价和打包方案并得到相应的优化方案成功率。为了检验模型的可靠性,我们建立了仿真模拟模型,对每个用户行为进行仿真,结果显示模拟成功率与优化方案成功率偏差在20%以内。 最后我们对模型的鲁棒性和灵敏度进行了检验,发现模型具有较好的鲁棒性。
模型假设:
1. 假设会员到所有任务点的出行便利程度一致,到达任务点所用时间随距离增加而增加,且该距离为直线距离;
2. 不考虑天气等原因对会员出行的影响;
3. 所有任务的难度相同,即不考虑任务难度对会员选择造成的影响;
4. 每个任务至多由一个人完成,不考虑多人合作完成一个任务的情况。
问题分析:
问题一分析
问题一要求我们探索定价规律及研究任务未完成的原因。从系统角度出发考虑每个任务的定价有两个方向:任务与用户的关系、任务与任务的关系。从这两个角度考虑,我们可以进一步分析任务与用户的关系主要有任务周围用户数量,任务周围用户密度等;任务与任务之间的关系主要为任务的离群程度。 我们可以对以上因素量化,并分别将定价与以上因素进行函数拟合,利用拟合度判断定价是否与以上因素有关。接着根据有关的因素对完成的任务与未完成的任务分别进行分析,判断任务未完成的具体原因。
问题二分析
问题二要求我们设计新的任务定价方案,并和原方案进行比较。这是一个博弈问题的优化,博弈双方是定价与成功率。我们的目标是成功率尽可能高,定价尽可能低。成功率除了与定价有关,还与问题一中的若干影响因素有关。我们可以回归分析得到成功率关于以上因素的函数关系。 接下去可以建立优化模型并求解。根据给出的数据集,我们寻找成功执行的任务定价与未成功执行任务的定价之间的差距,并寻找合理的定价区间。以该区间为约束,分别就成功率最高及定价总和最低为目标,将其划分为两个优化模型并求解能得出总定价固定的情况下成功率最高的定价方案以及成功率固定总定价最低的定价方案。得出方案后可以就成功率与定价与原方案进行对比来判断新
定价获得的效果。
问题三分析
问题三要求考虑多任务打包发布,修改定价并分析对任务完成情况的影响。由于本题任务点分布不均匀,我们考虑对DBSCAN算法进行改进:算法的半径改为得分半径,成功率高的点得分高,成功率低的点得分低。为了提高成功率,我们将成功率低的点与成功率高的点打包。打包后还需要分析打包的合理性,即打包任务周边会员的信誉、限额等因素,如果合理就保留该包,不合理就打散该包。
关于打包任务的定价,在本问题中我们将定价分为两部分:任务本身价值、路途花费。即任务打包后任务的本身价值不变,但由于路途花费(包括时间、交通费用)减少,在系统定价时打包的任务总价低于原定价总和。根据原数据找到任务本身价值、路途划分、总定价三者的关系,再根据问题二得到的优化模型进行最优定价搜寻,最终可以对比打包前后成功率的变化情况来体现打包的效果。
问题四分析
问题四给出了一个新项目,要求给出我们的定价方案及评估方案实施效果。 将数据代入问题二得到的定价模型以及问题三得到的打包模型进行求解,输出每个任务定价与成功率数据,并对结果进行分析。