【精】A user-based bike rebalancing strategy for free-floating bike sharing systems: A bidding model

A user-based bike rebalancing strategy for free-floating bike sharing systems: A bidding model

在这里插入图片描述

@article{BIM2021,
address = {Univ Hong Kong, Dept Ind & Mfg Syst Engn, Haking Wong Bldg,Pokfulam Rd, Hong Kong 999077, Peoples R China},
author = {Cheng, Yao and Wang, Junwei and Wang, Yan},
doi = {10.1016/j.tre.2021.102438},
issn = {1366-5545},
journal = {TRANSPORTATION RESEARCH PART E-LOGISTICS AND TRANSPORTATION REVIEW},
mendeley-groups = {rebike21-23},
title = {{A user-based bike rebalancing strategy for free-floating bike sharing systems: A bidding model}},
volume = {154},
year = {2021}
}

Abjact

Along with the fast deployment of bike-sharing systems (BSS) nowadays is the bike imbalance problem induced by the demand variability. In this study, we design a user-based bike rebalancing (UBR) strategy to solve the bike imbalance problem in a free-floating bike sharing system
(FBSS), where the user arrival and incentive budget allocation of the FBSS are both dynamic. Specifically, we design a dynamic bidding-model-based incentive mechanism (BIM) to progressively determine the incentive price, based on which users are assigned the rebalancing task. The proposed BIM is proved to be budget feasible, incentive compatible, and competitive. We use a set of bike sharing data to numerically verify the effectiveness of BIM in improving the service level of FBSS. Furthermore, we find that the BIM outperforms the post-price-based incentive mechanism (PIM), with its advantage negatively correlated with user irrationality. Some managerial insights and potential research opportunities are provided for urban planners, policy makers and BSS practitioners

随着自行车共享系统(BSS)的快速部署,由需求变化引起的自行车不平衡问题日益突出。在本研究中,我们设计了一个基于用户的自行车再平衡(UBR)策略来解决自由浮动自行车共享系统(FBSS)中的自行车不平衡问题,其中用户到达和FBSS的激励预算分配都是动态的。具体而言,我们设计了一种基于动态竞价模型的激励机制(BIM,以逐步确定激励价格,并在此基础上为用户分配再平衡任务。所提出的BIM被证明是预算可行、激励相容和有竞争力的。我们使用一组自行车共享数据来数值验证BIM在提高FBSS服务水平方面的有效性。此外,我们发现BIM优于基于后价格的激励机制(PIM),其优势与用户非理性负相关。为城市规划者、决策者和BSS从业者提供了一些管理见解和潜在的研究机会.

Highlights

  • 提出了一种新的基于投标模型的激励机制(BIM),以鼓励自行车用户在自由浮
  • 动的共享单车系统(FBSS)中参与自行车再平衡
  • 开发改进的GetThreshold算法,逐步获得最优激励价格。
  • BIM与基于后价格模型的激励机制(PIM)的性能比较
  • 考虑用户的非理性对BIM有效性的影响。

1. introduction

1.1Bike rebalancing problem of bike sharing systems (BSS)

自本世纪末以来,自行车共享系统(BSS)在世界范围内得到了迅速发展和采用(Shui和Szeto,2020)。☀️截至2019年8月,中国共有19500000辆共享自行车和300000名注册用户(国家信息中心,2019年)。特别是,随着先进技术的快速发展,近五年来,全球范围内,特别是在北京、上海和深圳等大城市,自由漂浮BSSFBSS)[ free-floating BSS (FBSS)]大量涌入。与基于站点的BSSSBSS)[ station-based BSS (SBSS)]相比,FBSS更经济,因为它避免了建造扩展底座和信息亭机器,同时为用户提供了更高的灵活性。随着BSS的快速部署,需求变化导致自行车不平衡问题,这直接导致自行车需求得不到满足。为了保持BSS的服务水平,有必要将自行车从过剩的地方重新定位到短缺的地方。这被定义为自行车再平衡问题。

到目前为止,已经提出了两种类型的自行车再平衡策略:🐸基于运营商的自行车再平衡(OBR)策略[operator-based bike rebalancing (OBR) strategy]和🐸基于用户再平衡策略(UBR)策略[based bike rebalancing (UBR) strategy]。OBR策略使用车队将自行车从盈余车站运送到赤字车站。迄今为止,学者们已经为 SBSS 提出了优秀的 OBR 策略.

一般来说,UBR 战略从需求/库存管理的角度重新定位自行车(水和司徒,2020年),比OBR战略受到的关注要少得多。它主要提供激励或实施法规,以鼓励/要求用户参与自行车再平衡。现有的UBR策略主要可分为三类:两种监管中的最佳、停车位保留和动态定价激励(Shui和Szeto,2020)。通过允许用户选择两个站点并要求他/她在负载较低的站点下车,两个法规中的最佳法规提高了SBS的性能。Kaspi等人(2014年)通过比较完全、部分和无停车位预订策略的性能,研究停车位预订问题。结果表明,完全停车预约策略实现了最低的总剩余时间,而部分停车预约策略比没有停车位预约策略节省了更多的剩余时间动态定价激励是应对自行车库存水平快速变化的最常用激励措施(Shui和Szeto,2020)。对于SBSS,

  • Chemla等人(2013年)动态确定每个站点的激励价格,以最大化自行车服务水平或最小化用户的出行成本。
  • PFROMMER等人(2014)和辛格拉等人(2015A)考虑了SBS在激励机制设计中的当前和预计需求供给条件。具体而言,Pfrommer等人(2014年)结合了OBR策略和实时UBR策略,根据SBS的当前和预测自行车需求-供应条件计算动态变化的客户回报。通过设计的UBR策略,鼓励客户在附近未充分使用的车站下车,因此,OBR的预期成本降低。
    * Singla等人(2015a)提出了一种众包机制,在在线学习中采用后悔最小化的方法。
  • Haider等人(2018年)还提出了一种激励机制,鼓励用户在邻近车站上下车,以形成枢纽站。然后,减少了OBR的需求。
  • Waserhole和Jost(2012)开发了一个连续时间马尔可夫模型,以确定具有激励的总出行价格。
  • Li和Liu(2021)提出了一个混合整数非线性非凸问题来设计静态情景下SBS的UBR策略(包括出行成本、不平衡惩罚和激励成本)。
  • Angelopoulos等人(2018年)根据不同车站随时间变化的自行车和停车场需求,设计UBR策略.

上述UBR策略主要针对SBSS设计。对于FBSS,

  • Reiss和Bogenberger(2017)
    1评估了OBR和UBR策略,并指出这两种策略可以杂交
  • Zhang等人(2019年)开发了一种定价机制,以确定用户的总出行价格,作为用户下车地点供应不足程度的函数。
  • Singla等人(2015a)研究了预算约束下的最优激励价格,其中用户的距离成本是随机分布的,可以通过在线学习过程进行估计。
  • Pan等人(2019年)还为FBSS中的UBR策略设计开发了一个深度强化学习框架,其中用户的成本与额外的旅行距离成比例。注意,UBR的成功依赖于用户的合作和理性。
  • 一些研究假设用户完全合作(Fricker和Gast,2016),而另一些研究假设用户在做出接受/拒绝决定之前评估其无用性(时间和金钱成本)(Chemla等人,2013年;Haider等人,2018年;Pfrommer等人,2014年;Zhang等人,2019年)。

1.2. Research motivation and contribution

目前对自行车再平衡问题的研究主要集中在OBR策略设计上,无论是作为战术问题(即静态情景下的自行车再平衡)还是作为操作问题(即动态情景下的自行车再平衡)。他们有效地重新平衡自行车分布,特别是在大型SBS中。尽管如此,OBR可能导致空气污染(Shui和Szeto,2018;Singla等人,2015a)。同时,它是在常规基础上运行的;因此,在下一次再平衡操作之前,无法满足这些供应不足的电站的所有需求。此外,自行车再平衡问题在FBSS中变得更为复杂,因为自行车在该区域动态随机分布。捕捉自行车位置的困难导致运营成本高。因此,需要在时间和空间上灵活的自行车再平衡策略,有效解决自行车FBSS中的再平衡问题.<.font>

通过鼓励用户实时重新平衡自行车,UBR策略有效地提高了BSS的服务水平(Ruch等人,2014年),并将“禁止停车”事件的数量保持在较低水平(Chemla等人,2013年)。大多数现有的UBR研究以SBSS为目标,并采用基于后价格模型的激励机制(PIM)[ post-price-model-based incentive mechanism (PIM)],即:。E用户根据BSS运营商提供的激励价格做出接受或拒绝决定。PIM的优势显而易见:用户有机会提前获得激励价格,合作意愿相对稳定。同时,在运营层面,运营商只需提供价格,无需额外计算或决策。尽管如此,通过使用PIM,BSS运营商只从用户那里收集二进制响应,而不是他们期望奖励的确切值。因此,运营商无法快速将激励价格收敛到最优值。因此,需要设计一种基于实时的UBR策略来描述FBS的特性。

在本研究中,我们通过设计一种基于竞价模型的激励机制(BIM)[ bidding-model-based incentive mechanism (BIM]来提出这样一种UBR策略,以在具有动态用户到达和激励预算的FBS中重新平衡自行车。我们在图1中描述了BSS环境下PIM和BIM的基本机制。在这里插入图片描述Fig.1PIM和BIM的示意图。(a)PIM.(b)BIM

  • (a)PIM
    运营商:假设给你报酬 p u p^u pu,你同意在建议位置停车吗?
    用户:yes/no

  • (b)BIM
    运营商:在建议位置停车的cost是多少?
    用户:我的成本是…
    运营商:我接受/不接受你的竞价。

在不丧失普遍性的情况下,所设计的BIM需要
(i)预算可行,(ii)激励相容(即,用户以真实成本投标),(iii)竞争性(即,实现近似最优)和(iv)描述FBS中UBR问题的特征。
事实上,在在线劳动力众包市场(Singer和Mittal,2011;Singer和Mittal,2013)的背景下,投标模型[bidding model ]同质和静态任务分配中[homogeneous-and-static task assignment]表现良好,这与FBSS中的UBR问题有一些相似之处。首先,这两个问题都涉及用户参与任务分配并以最大化任务分配成功率为目标;同时,预计将最大限度地利用现有激励预算。然后,需要在多个视界中分配任务,其中一定比例的用户竞购每个视界中一定比例的任务。为了解决众包市场中的任务分配问题,Singer和Mittal(2011)开发了GetThreshold算法,以逐步确定每个范围内的激励价格。该算法通过从以前的视界中获取投标信息,逐步将激励价格收敛到最优值。

这两个问题之间的相似性证明了在FBSS中使用基于BIM的UBR策略的合理性。然而,FBSS中的UBR问题更为复杂。

  • 首先,任务的数量取决于进入FBSS的用户数量,因为任务是由用户创建的。
  • 其次,就任务数量和可用激励预算而言,UBR问题是动态的。

因此,在第k个周期内,单纯参考之前周期内征求的投标信息来确定激励价格是不合适的。相反,第k个范围内的激励价格需要考虑(i)之前范围内的用户投标信息和(ii)第k个范围内的预测用户到达和可用预算。因此,需要改进GetThreshold算法以逐步确定激励价格。

本研究首次提出并开发了基于BIM的FBSS动态UBR策略,填补了上述空白。通过采用动态BIM,可有效提高FBSS中的自行车再平衡水平。通过将BIM的性能(即受到激励的用户比例和FBS的服务水平)与其他两种UBR策略进行比较,验证了这一点。我们进一步建议,当预算规模较小时,应特别推荐BIM。然而,BIM的有效性与用户的非理性呈负相关。为城市规划者、决策者和FBSS运营商提供了一些卓越的管理见解。

1.3. Paper organization

本文的其余部分组织如下。第2节介绍了基于BIM的UBR问题以及详细的场景和假设。第3节开发了一种改进的GetThreshold算法,以逐步确定激励价格,在此基础上,我们设计了动态BIM,以在整个分析期间分配自行车再平衡任务。证明了BIM的激励相容性、预算可行性和竞争力。第4节通过比较BIM与其他两种UBR策略的性能来验证BIM的有效性。我们在第5节中提供了一些管理见解和未来的研究方向。

2. UBR problem statement and scenarios

我们将一个分析周期 (analysis period )划分为长度相等n个视野[ horizons]。激励预算 M ( k ) M(k) Mk在第k个视界 ( k = 1 , … , n ) (k=1,…,n) k=1n开始时分配,其中M(k)受到FBSS操作员的实时调整,并包括以前 ( k − 1 ) (k-1) k1视界中未使用的预算假设用户是同质的,并且愿意行驶最多 d m a x d_{max} dmax的额外距离,以便将自行车停放在建议的位置,在分析期间 d m a x d_{max} dmax始终适用于所有用户。具体而言,1️⃣用户 u u u到达后,2️⃣FBSS操作员建议他或她将自行车停在位置 l u l_u lu(用户需要行驶一段距离 d u d_u du才能到达 l u l_u lu,其中 d u ⩽ d m a x d_u⩽d_{max} dudmax),并询问投标价格。如果出价 b u b_u bu小于或等于 p k p_k pk,则3️⃣分配再平衡任务,并向用户u支付激励价格 p k p_k pk。注意到

  1. 建议的位置 l u l_u lu因用户而异。具体而言, l u l_u lu

    (i)在用户u的最大行驶距离 d m a x d_{max} dmax内,从他或她最初打算下车的地方,以及
    (ii)在第k个视界的自行车库存水平和第 ( k + 1 ) (k+1) k+1个视界的(预测)自行车需求之间具有最大“不平衡”程度的位置。
    这样的政策有助于最大限度地提高 ( K + 1 ) (K+1) K+1期自行车服务水平。读者可以参考(Wang,2020)找到计算 l u l_u lu的详细算法。在本研究中,假设 l u l_u lu是给定的。

  2. 预测共享自行车交通的有效方法包括(i)基于模型的方法(例如,组合时间序列方法(Toman等人,2020)和删失高斯过程(Gammelli等人,2020)),(ii)数据驱动方法(例如,具有数据驱动图形滤波器的图卷积神经网络(Lin et al.,2018)、长-短记忆神经网络(Xu et al.,2018)、时空模式检测(Sohrabi和Ermagun,2021)、梯度推进回归树和随机森林(Li et al.,2015))和(iii)模拟研究(Yang et al.,2019)。这些方法可用于预测FBS中的自行车需求。
  3. 用户u的总额外距离成本 c u c_u cu与他/她的旅行距离 d u d_u du,呈线性相关。如: c u = β ⋅ d u c_u=β⋅d_u cu=βdu。系数 β β β是一个具有累积分布函数(CDF) F β ( ⋅ ) F_β(\cdot) Fβ()随机变量,且系数FBSS操作员仍然不知道。
  4. 考虑到用户的非理性,用户u可能会也可能不会以其真实距离成本出价,即。 b u b_u bu可以等于 c u c_u cu,也可以不等于 c u c_u cu

理解:
b u b_u bu:用户竞价价格,可能不等于心理成本价
c u c_u cu:用户心理成本价。与距离单位成本 β \beta β(操作员不知),且 β \beta β是一个随机变量。
p k p_k pk:运营商在 k k k时段的激励价格

为了在整个分析期间最大化成功分配任务的数量,FBSS 操作员需要设计一个动态的在第 k 个范围开始时逐步确定最优激励价格 p k ( k = 1 , . . . , n ) p_k(k=1,...,n) pk(k=1,...,n) 的激励机制
p k p_k pk 的value应该是一下几个要素的函数

(i) 预算 M ( k ) M(k) M(k)
(ii) 在前 ( k − 1 ) (k-1) (k1) 个范围内征求的投标信息(bidding information) B B B
(iii) 预测在第 k 个水平 N ( k ) N(k) N(k) 中进入 FBSS 的用户数量。

3. A bidding-model-based incentive mechanism (BIM)

为了确保机制的激励容量[incentive compatibility of the mechanism,],运营商需要保证激励价格独立用户的出价(Blum和Mansour,2007;Cesa Bianchi等人,1997;Littlestone和Warmuth,1989)。Singer和Mittal(2011)研究了众包市场中的同质和静态任务分配。在该问题中,总预算M和总用户数N在周期开始时是固定的和预先知道的,而任务数是无限的。然后,在 ⌊ l o g N ⌋ \lfloor log N\rfloor logN个视野(horizons)内分配任务,预算用户分配如下:

  • k = 1 , . . . , l o g ( N − 1 ) k=1,...,log(N-1) k=1,...,log(N1).
    M ( k ) = M / 2 k − 1 − l o g N M(k)=M/2^{k−1-log N} M(k)=M/2k1logN
    N ( k ) = N / 2 k − 1. − l o g N N(k)=N/2^{k−1.−log N} N(k)=N/2k1.logN
  • k = log ⁡ N k=\log N k=logN时有,
    M ( k ) = M − ∑ k = 1 l o g N − 1 M / 2 k − 1 − l o g N M(k)=M-\sum_{k=1}^{log N-1}M/2^{k−1-log N} M(k)=Mk=1logN1M/2k1logN
    N ( k ) = N − ∑ k = 1 l o g N − 1 N / 2 k − 1 − l o g N N(k)=N-\sum_{k=1}^{log N-1}N/2^{k−1−log N} N(k)=Nk=1logN1N/2k1logN
    未使用的预算将不会累积到下一期horizon。

为了最大化分配的任务数量,开发了GetThreshold算法,以获得第k个视界(horizon) 开始时的 p k p_k pk(表1)。如果用户u的投标价格 b u b_u bu小于或等于 p k p_k pk,则为其分配具有激励价格 p k p_k pk的任务。在计算 p k p_k pk,算法

(i)汇总分配给前(k-1)期的预算,即前面的预算求和
(ii)将前(k-1)期的招标信息(solicited bidding information)升序排序为 B = { b 1 , . . . , b i , . . . , b ∑ β = 1 k − 1 N ( β ) } B=\{b_1,...,b_i,...,b_{\sum^{k-1}_{\beta =1}N(\beta)}\} B={b1,...,bi,...,bβ=1k1N(β)}
(iii) 获得 p k p_k pk作为 p k = min ⁡ { ( ∑ β = 1 k − 1 M ( β ) ) / ( u − 1 ) , b u } p_k=\min \{\Big(\sum_{\beta=1}^{k-1}M(\beta)\Big)/(u-1),b_u\} pk=min{(β=1k1M(β))/(u1),bu},where u = m i n { i : b i > ( ∑ β = 1 k − 1 M ( β ) ) / i ; i = 1 , . . . , ∑ β = 1 k = 1 N ( β ) } u=min\{i:b_i >\Big(\sum^{k-1}_{\beta=1}M(\beta)\Big)/i;i=1,...,\sum^{k=1}_{\beta=1}N(\beta)\} u=min{i:bi>(β=1k1M(β))/i;i=1,...,β=1k=1N(β)}.

因此,在前一个 ( k − 1 ) (k-1) (k1)视界中分配任务的用户数量最大化的激励价格被用作 p k p_k pk。预计激励价格 p k p_k pk将很好地平衡用户出价和 k t h k^{th} kth范围内的 M ( k ) M(k) Mk

在这里插入图片描述

理解:

  1. 分配任务包含 预算分配和用户分配 ,且任务数量是无限的。所以要在有限的预算和用户下尽可能的完成更多的再平衡任务?
  2. 激励价格 p k p_k pk获取中, M ( β ) M(\beta) M(β)是前面第 β \beta β个horizon的预算, N ( β ) N(\beta) N(β)是前面第 β \beta β个horizon的用户数量。 ( ∑ β = 1 k − 1 M ( β ) ) \Big(\sum^{k-1}_{\beta=1}M(\beta)\Big) (β=1k1M(β))是前面 k − 1 k-1 k1个的总预算, ∑ β = 1 k = 1 N ( β ) \sum^{k=1}_{\beta=1}N(\beta) β=1k=1N(β)是前面 k − 1 k-1 k1个的总用户。 ( ∑ β = 1 k − 1 M ( β ) ) / i \Big(\sum^{k-1}_{\beta=1}M(\beta)\Big)/i (β=1k1M(β))/i 是假设有 i i i个用户平分前 k − 1 k-1 k1的总预算,可以看做是平均激励价格; b i b_i bi是第 i i i个用户的竞价.当i的值很小的时候如i=1,i=2,则 b i > ? b_i> ? bi>是不成立的,而i的值很大的时候, b i > ? b_i> ? bi>是成立的。我们选择条件成立的最小的 i i i,记为 u u u.
  3. min( u u u个用户的平均激励价格,第 u u u个用户的竞价),即为下一个horizon的激励价格。

3.1. An improved GetThreshold algorithm

GetThreshold算法是在静态场景下开发的,对于 M ( k ) / N ( k ) = M ( k + 1 ) / N ( k + 1 ) M(k)/N(k)=M(k+1)/N(k+1) M(k)/N(k)=M(k+1)/N(k+1for k = 1 , … , l o g N k=1,\dots,logN k=1,,logN.。在这样的假设下,激励价格 p k p_k pk可以仅依靠以前 ( k − 1 ) (k-1) k1期的投标和预算信息进行无偏计算。尽管如此,在FBSS中,用户动态地到达系统,同时,操作员可以实时地调整 M ( k ) M(k) M(k) ,并且在先前(k-1)视界中未使用的预算被累积到第k视界中以激励更多用户。因此,完全依靠历史信息来计算 p k p_k pk是不合适的。我们在此开发了一种改进的GetThreshold算法来计算BIM的动态 p k p_k pk

我们假设在第 ( k − 1 ) (k-1) k1个视界的末端, M ( k ) M(k) Mk是已知的, N ( k ) N(k) Nk是可预测的。我们通过考虑历史数据(即预算 ∑ β = 1 k − 1 M ( β ) ∑_{\beta=1}^{k-1}M(\beta) β=1k1M(β)和投标信息 B B B未来信息(即M(k)和N(k)))来获得 p k p_k pk见Table 1。 特别是不使用累计预算 ∑ β = 1 k − 1 M ( β ) ∑^{k−1}_{β=1}M(β) β=1k1Mβ,我们采用可调整预算 M ′ M′ M计算 p k p_k pk,其中 M ′ M′ M满足 M ′ / ( ∑ β = 1 k − 1 N ( β ) = M ( k ) / N ( k ) M′/(∑^{k−1}_{β=1}N(β)=M(k)/N(k) M′/(β=1k1N(β)=M(k)/N(k)。因此,调整了第k个范围内的“每用户平均预算”。改进算法和BIM表2所示,其中 u ( K ) u(K) u(K)是用户 u u u在第 K K K个horizon 到来。

在这里插入图片描述

3.2BIM’s budget feasibility and incentive compatibility

很明显,BIM 是预算可行的,因为当预算用完时,激励过程停止。在下文中,我们通过检查用户的效用函数[user’s utility function]来证明其激励可容性[incentive compatibility](即理性用户以其真实距离成本出价)。
在这里插入图片描述
第k个视界中,具有距离成本 c u c_u cu的用户u被告知 p k p_k pk的存在(但不是确切值)。用户u有三个竞价选项,分别是:以高于、等于或低于真实成本 c u c_u cu b u b_u bu竞价。我们在表3中用三个选项显示了用户u的实用程序。明确地

  • b u < p k b_u<p_k bu<pk的情况下:in case c u ⩽ p k c_u⩽p_k cupk,用户u被分配任务并获得正的效用 p k − c u p_k−c_u pkcu.
    in case c u > p k c_u>p_k cu>pk,用户u

    1. 接受任务并且获得一个负的效用 p k − c u p_k−c_u pkcu.,当 b u > p k b_u>p_k bu>pk的情况下.
    2. 没有接受任务并获得一个为0的效用,当 b u > p k b_u>p_k bu>pk.

    然后,当 b u < c u b_u<c_u bu<cu,用户u有一个整个效用的期望在Eq(1).

U ( b u < c u ) = P ( c u ≤ p k ) ⋅ ( p k − c u ∣ c u ≤ p k ) + ( 1 − P ( c u ≤ p k ) ) ⋅ P ( b u < p k ) ⋅ ( p k − c u ∣ c u > p k ) (1) \begin{aligned}U(b_u<c_u) \\ =P(c_u\leq p_k)\cdot (p_k-c_u|c_u\leq p_k)+(1-P(c_u\leq p_k))\cdot P(b_u<p_k)\cdot(p_k-c_u|c_u>p_k)\tag{1}\end{aligned} U(bu<cu)=P(cupk)(pkcucupk)+(1P(cupk))P(bu<pk)(pkcucu>pk)(1)

  • b u = p k b_u=p_k bu=pk的情况下: in case c u ⩽ p k c_u⩽p_k cupk,用户u被分配任务并获得正的效用 p k − c u p_k−c_u pkcu.
    in case c u > p k c_u>p_k cu>pk,用户u不接受任务且获得一个为0的效用。
    然后,当 b u = c u b_u=c_u bu=cu时,用户u有一个整个效用的期望在Eq(2).

U ( b u = c u ) = P ( c u ≤ p k ) ⋅ ( p k − c u ∣ c u ≤ p k ) (2) \begin{aligned}U(b_u=c_u)=P(c_u\leq p_k)\cdot (p_k-c_u|c_u\leq p_k)\end{aligned}\tag{2} U(bu=cu)=P(cupk)(pkcucupk)(2)

  • b u > p k b_u>p_k bu>pk的情况下:in case c u ⩽ p k c_u⩽p_k cupk,用户不接受任务分配并获得一个为0的效用。
    in case c u < p k c_u<p_k cu<pk,用户u

    1. 接受任务并且获得一个负的效用 p k − c u p_k−c_u pkcu.,当 b u ≤ p k b_u\leq p_k bupk的情况下
    2. 没有接受任务并获得一个为0的效用,当 b u > p k b_u>p_k bu>pk.

    然后,当 b u > c u b_u>c_u bu>cu,用户u有一个整个效用的期望在Eq(3).

U ( b u > c u ) = P ( c u ≤ p k ) ⋅ P ( b u < p k ) ⋅ ( p k − c u ∣ c u ≤ p k ) (3) \begin{aligned}U(b_u>c_u)=P(c_u\leq p_k)\cdot P(b_u<p_k) \cdot (p_k-c_u|c_u\leq p_k)\end{aligned}\tag{3} U(bu>cu)=P(cupk)P(bu<pk)(pkcucupk)(3)

很明显, U ( b u = c u ) > U ( b u < p k ) U(b_u=c_u)>U(b_u<p_k) Ubu=cu>Ubu<pk总有 − P ( c u > p k ) ⋅ P ( b u < p k ) ⋅ ( p k − c u ∣ c u > p k ) ⩾ 0 -P(c_u>p_k)\cdot P(b_u<p_k)\cdot(p_k-c_u|c_u>p_k)⩾0 P(cu>pk)Pbu<pk(pkcucu>pk)0.
类似地, U ( b u = c u ) > U ( b u > c u ) U(b_u=c_u)>U(b_u>c_u) Ubu=cu>Ubu>cu始终有 P ( c u ≤ p k ) ⋅ P ( b u ≥ p k ) ⋅ ( p k − c u ∣ c u ≤ p k ) ≥ 0 P(c_u\leq p_k)\cdot P(b_u\geq p_k)\cdot (p_k-c_u|c_u\leq p_k)\geq 0 PcupkP(bupk)(pkcucupk)0.
因此,理性的用户u将始终按照拟议BIM下的真实距离成本投标,以实现效用最大化

在第4节中,我们通过数值验证了BIM的竞争力(即接近最优)。

4. Numerical studies

为了检验基于 BIMUBR 策略的性能,我们使用了真实的自行车共享数据,其中没有实施再平衡措施。具体来说,我们在美国华盛顿特区选择了一个拥有25个自行车站的市中心区域,收集在每个站上下车的自行车的相关信息(https://www. capitalibikeshare.com/system data)。从2018年10月20日至10月27日,有10240辆和10530辆自行车在选定区域上下车。作为自行车的 picked up and dropped off 总数大约相等,我们认为这个区域是一个封闭的BBS。

我们把一天分成24个视界(horizons)。对于第k个horizon,我们将在station i i i 在第k个horizon 中的8天期间的上下车自行车数量(即,如原始数据资源所示,在该站显示“开始/结束”的自行车数量)汇总为station i i i 上下车的自行车总数。为了将原始 SBSS 数据转换为 FBSS 数据,我们假设自行车仅在 FBSS 中沿路边取下。此外,在 SBSS station i i i 下车的自行车在FBSS中沿道路 v v v下车的概率为 P ( i , v ) P(i,v) P(i,v),其中 P ( i , v ) P(i,v) P(i,v)满足以下条件:

  1. P ( i , v ) P(i,v) P(i,v)与station站 i i i与road路 v v v之间的距离呈负相关;
  2. ∑ ∀ v ∈ V P ( i , v ) = 1   ∀ i ; V \sum_{\forall v\in V}P(i,v) =1 \ \forall i; V vVP(i,v)=1 i;V是在FBSS中的所有道路roads的集合。

我们发展 P ( i , v ) = κ e − κ ⋅ d i s ( i , v ) / ( ∑ ∀ v ∈ V κ e − κ ⋅ d i s ( i , v ) ) P(i,v)=\kappa e^{-\kappa \cdot dis(i,v)}/(\sum_{\forall v \in V}\kappa e^{-\kappa\cdot dis(i,v)}) P(i,v)=κeκdis(i,v)/(vVκeκdis(i,v))作为归一化指数公式,where d i s ( i , v ) dis (i,v) dis(i,v)是station i i i和road v v v之间的距离,系数 κ = 0.5 \kappa =0.5 κ=0.5.然后我们假设用户有一个距离成本(即投标价格) c u = β ⋅ d u c_u=β⋅d_u cu=βdu,其中 d u d_u du是指 (i)用户打算下车的位置(即道路)(根据归一化指数公式模拟)和(ii)建议用户下车的位置(即道路)之间的距离(参考(Wang,2020)如第2节声明I所述)。系数 β β β呈均匀分布 CDF β ∼ U ( 0 , 0.005 ) β∼U(0,0.005) βU0,0.005用户愿意上下车的最长距离分别为100米和200米

我们从(i)成功投标(bid)的用户比例和(ii)提高FBSS的服务水平 两个方面检查 BIM 的性能。将这两个指标与其他两种UBR策略得到的指标进行比较。这两种UBR策略分别采用基于 后价格的激励机制(PIM)和基于离线价格的激励机制(offline-price-based incentive mechanism OIM,前者根据动态预算采购-置信上限(Dynamic Budgeted Procurement-Upper Confidence Bounds DBP-UCB)算法(Singla等人,2015b)获得激励价格基于GetThreshold算法得到激励价格。明确地,

  • 基于PIM 的 UBR 中,向用户 u u u 提供了一个激励价格,用户u需要根据该价格确定是否接受或拒绝再平衡任务。与在第k个周期内采用恒定激励价格 p k p^k pkBIM 不同,PIM 不一定为第k个周期内的用户提供相同的激励价格。具体而言,激励价格向量由运营商预先确定。通过 DBP-UCB 算法从向量中选择特定的激励价格,并根据先前用户对向量中所有价格的接受决定(previous users’ acceptance decisions )提供给用户 u u u 。然后,用户决定是否接受激励价格。遵循这一原则,很少提供且接受率低的激励价格为后续用户提供了更多机会。DBP-UCB算法的详细信息见附录A(见表A1)DBP-UCB算法 已被证明是激励相容和预算可行的

  • 在基于 OIMUBR 中,假设所有用户的距离成本都是在8天周期开始时索取的。根据完整的投标信息获得最优激励价格时,将在整个期间采用最优激励价格。OIM 与激励不兼容,因为提前获得所有用户的投标价格是不现实的。尽管如此,OIM获得的最优激励价格可作为基准,以验证基于BIM的 UBR 的有效性。

在这里插入图片描述

我们在第4.1节中证明了 BIM 的竞争力(因此也是有效性)。通过模拟(i)根据BIM成功投标的用户数量和(ii)FBS的服务水平(根据8天内成功取车的用户比例)。将这两项指标与PIM和OIM下获得的指标进行比较。然后我们在第4.2节中考虑用户的不合理性, 即,用户出价高于真实距离成本(没有理由出价低于真实距离成本)。我们数值分析了用户非理性对BIM有效性的影响。仿真由Matlab编程,并在配备双2的DELL计算机上执行。50 GHz CPU和8 GB RAM。
在这里插入图片描述
Fig. 2. Incentive prices under the three incentive mechanisms.在三种激励机制下的激励价格。

在这里插入图片描述 Fig. 3. . Users being incentivized by the three mechanisms. 用户受到这三种机制的激励。

图2中,我们获得了三种激励机制下的最优激励价格,激励预算为6000美元,其中 OIM 产生的恒定激励价格为0.6543和BIM逐渐收敛到该基准值。然后,我们在图3中绘制了总数三种激励机制下的奖励(激励用户总数和比例)。随着用户逐渐进入FBS(图3的X轴),我们观察到

  1. BIM优于PIM,前者激励10530个用户中的9092个,后者激励8037个。这是因为BIM收集用户的准确投标价格,以支持FBSS运营商计算准确的激励价格,而PIM仅获取用户是否接受激励价格的二进制信息。因此,BIM比PIM更快接近真正符合用户心理价格的激励价格。
  2. BIM是有竞争力的,即, 在满足一定比例的客户成功投标的情况下,实现了接近最优的激励价格。具体而言,随着用户数量的增加,BIM 激励的用户比例逐渐接近OIM激励的用户比例

在这里插入图片描述 Fig. 4.Accumulated proportion of users being incentivized by the three mechanisms under different incentive prices.三种机制在不同激励价格下激励用户的累计比例

我们还研究了在不同激励价格下,三种机制激励的用户比例。在图4中,用户逐渐进入fbs(即,迭代次数从图4(a)中的106增加到图4(d)中的2102)。当激励价格上涨时,BIM不断提高其准确性并接近基准值。此外,BIM在大多数情况下都优于 PIM,尤其是在早期阶段(如图4(a))。

在这里插入图片描述

在不同预算下,BIM和PIM在提高FBSS服务水平(即,成功取车的用户比例)方面的表现如表4所示。与PIM相比,BIM总是能够激励更多的用户,从而在更大程度上提高FBSS服务水平。当预算规模较小时,这种优势尤为明显,这再次证明了BIM在快速收敛到最优激励价格方面的优势。注意,OIM 的绩效未列报,因为它与激励不兼容。

4.2. User irrationality

经数值验证,当所有用户以真实成本投标时,BIM的表现优于PIM。尽管如此,在实践中,**用户可能是不理性的,因为他们要么不信任运营商,要么没有彻底了解投标机制。**在此,我们考虑用户的不合理性,并分析其对BIM的有效性的影响。

在这里插入图片描述Fig. 5Cumulative proportion of users being incentivized by the BIM with user irrationality. BIM因用户不合理而激励用户的累计比例

出于自身利益,用户不会以低于真实距离成本的价格出价。我们假设用户u将以真实距离成本 c u c_u cu(随机)和1之间随机分布的价格出价。将非理性用户的比例表示为α%,我们模拟了当α%在0%到40%之间时,成功激励(通过不同激励价格p)的用户比例,并将其与OIM获得的基准进行比较图5)。显然,BIM的有效性随着α%的增加而降低,即。在任意激励价格下,成功激励用户的比例与用户非理性负相关。合理的解释是,基于未经证实的投标价格(高于用户的真实距离成本),运营商高估了用户的距离成本,并相应地提供了高于用户预期的激励价格。然后,预算在短时间内用完,后期进入FBS的用户甚至没有机会参与竞价游戏

同样,用户的非理性削弱了 BIM 相对于 PIM 的优势。当α%从0%增加到40%时,BIM逐渐失去其优势,后者分别以2000、4000、6000和8000的预算激励4069、6790、8037和9660名用户(表5)。当α%达到40%时,BIM不再优于PIM。
在这里插入图片描述

5. Discussions and conclusions

基于用户的自行车再平衡(UBR)问题引起了广泛的研究兴趣。设计一个预算可行、激励相容、竞争性强的激励机制是解决这一问题的关键。在此,我们设计了一个基于BIM的动态UBR策略,以鼓励用户参与FBSS中的自行车再平衡。具体而言,我们开发了一种改进的GetThreshold算法,以逐步确定激励价格,该价格是(i)先前视野中的激励预算和投标信息以及(ii)当前视野中的用户到达信息和预算分配的函数。基于开发的算法,自行车再平衡任务在分析期间动态分配。我们还进行了仿真研究,通过比较 BIM 和其他两种 UBR 策略在不同预算下的性能来验证 BIM 的有效性。

我们发现,BIM显著提高了FBS的服务水平,同时优于PIM。这种优势在预算小的情况下尤为显著。一种解释是,BIM获得了与用户心理距离成本相关的准确信息,因此可以准确预测用户在后续时间段的投标价格。因此,BIM 提供了一个激励价格,该价格正好满足用户的期望,并避免了预算浪费。注意,BIM相对于PIM的优势取决于用户的合理性。当非理性用户比例达到一定水平时,BIM的表现甚至比PIM还要差。

因此,我们为城市规划者、决策者和FBSS运营商提供以下管理见解。1️⃣第一,UBR策略有效地提高了FBSS的服务水平。因此,建议FBSS操作员考虑UBR在FBSS的应用。2️⃣第二,当仅分配少量激励预算时,BIM能够以较快的速度收敛到最优激励价格,因此,只要用户能够以真实成本合理出价,BIM就被大力推荐。3️⃣第三,BIM的有效性和成功在很大程度上取决于用户的理性。因此,建议城市规划师首先在用户教育水平较高的地区启动基于BIM的UBR战略。同时,鼓励FBSS运营商推广和解释投标机制,并在App上提供明确的指南。

本研究通过提出一种新的基于BIM的UBR策略,丰富了自行车再平衡问题的研究,这是在BSS背景下开发投标型激励机制的首批研究之一。同时,通过将其应用扩展到BSS领域,它也为招标文献做出了贡献。从实践的角度来看,本研究有效地提高了FBSS服务水平,并为自行车共享行业的利益相关者提出了显著的建议。

这项工作也有一些局限性。首先,需要进一步比较基于BIM和PIM的UBR策略与OBR策略的性能。同时,BIM要求用户准确的心理距离成本,与用户隐私泄露和价格歧视相关的风险需要仔细解决。政策制定者和BSS从业人员应特别注意采取有效措施,如(i)引入区块链,(ii)将用户的个人信息与其投标价格隔离,以及(iii)共享成功交易的投标价格,以提高信息透明度(但是,受隐私保护)。


  1. A Relocation Strategy for Munich’s Bike Sharing System: Combining an operator-based and a user-based Scheme ↩︎

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值