服务运营 | 共享出行平台的利润引擎:最佳动态定价策略

在这里插入图片描述

编者按:

定价问题是收益管理领域的一个重要问题,从九十年代到现在一直受到学界业界的广泛关注。而传统的定价问题结合新的商业场景,便可以焕发新的生命。在2010年代中期,Uber、Lyft等提供共享出行服务的公司逐一出现。商品容量(道路上的司机数量)是固定的,企业可以利用价格来控制需求和最大化收入。而共享出行作为一种新的商业场景,也有着一些有趣的新特性:首先,由于司机不直接受平台控制,动态定价的使用既是为了控制需求,也是为了管理供应;其次,对于平台来说,其目标不仅仅是实现收入最大化,还需要提高服务效率;最后,这个定价问题具有空间属性,需要将道路网络上车辆的分配成本考虑在内。下面我们选取了该领域的三篇研究进行介绍。

Dynamic Pricing of Relocating Resources in Large Networks

Reference: Santiago R. Balseiro, David B. Brown, Chen Chen (2021) Dynamic Pricing of Relocating Resources in Large Networks. Management Science 67(7):4075-4094.

原文链接:https://doi.org/10.1287/mnsc.2020.3735

Problem

随着共享汽车服务(例如Lyft和Uber)以及自行车共享平台的普及,对于如何有效管理在多个地点间流通的资源的需求日益增长。在这个场景中,有一个值得注意的现象是,资源的位置会随着时间而改变。本文的研究问题是:服务提供者如何为根据资源(如司机、自行车)移动的起点和终点制定价格,以最大化服务提供商的平均收入?

本研究旨在找到一个动态定价策略来优化服务提供者在无限视界的平均收入。

Method

本研究采用了中心辐射型的网络结构(如图1所示),这种在航空、交通和物流行业中非常普遍,例如航空公司的航线网络。在共享车辆系统中,中心辐射型的网络结构模拟了一个大城市网络,在这个网络中,通勤者往返于郊区(Spokes)和人口稠密的城市核心(Hub)之间。
在这里插入图片描述

这个问题可以被表述为一个无限视界的随机动态规划问题。假设网络中有1个hub和n个spoke,令0表示hub,1到n表示spoke,令 x i x_i xi表示地点 i ∈ [ 0 : n ] i\in[0:n] i[0:n]的资源量,m为总资源量。 q i 0 q_{i0} qi0表示顾客请求是 ( i , 0 ) (i,0) (i,0)(将资源从从地点 i i i转移到地点0)的可能性, q i = q i 0 + q 0 i q_{i}=q_{i0}+q_{0i} qi=qi0+q0i表示地点 i i i出现在请求中的可能性。
( i , 0 ) (i,0) (i,0)
平均利润最大化问题可写为:
在这里插入图片描述

其中 d i j , t π d_{ij,t}^{\pi} dij,tπ表示使用策略 π \pi π的情况下当请求为 ( i , j ) (i,j) (i,j)时在t时刻的需求水平; x i t π x_{it}^\pi xitπ表示使用策略 π \pi π的情况下地点 i i i在t时刻的资源量; y i j , t y_{ij,t} yij,t是一个0-1变量,当t时刻的请求为 ( i , j ) (i,j) (i,j)时等于1; r i j ( ⋅ ) r_{ij}(\cdot) rij()为收益函数; ξ t \xi_t ξt为服从正态分布的随机变量。

随后,将动态定价问题分解为更小的子问题,这些子问题对应于网络中的每个spoke。

对于每个子问题,使用拉格朗日松弛来处理资源非负约束。也即是,对于中心的资源数量约束 ∑ i ∈ [ n ] x i , t π ≤ m \sum_{i \in [n]}x_{i,t}^\pi\le m i[n]xi,tπm,通过引入拉格朗日乘子 λ \lambda λ来放松这个约束,允许中心的资源数量为负,但对中心的每个资源施加成本 λ \lambda λ。在放松了中心资源非负约束后,拉格朗日函数允许中心拥有无限资源,从而简化了问题。通过拉格朗日松弛,原始问题转化为对偶问题,其目标是最小化 λ \lambda λ的值,使得拉格朗日松弛的上界尽可能接近最优解。最后基于最优的拉格朗日松弛解,为每个子问题开发动态定价策略。这个策略根据当前资源的状态和顾客的支付意愿来调整价格。

Main Result

对于中心辐射型的网络结构,基于扰动的拉格朗日松弛的对偶公式,提出了一种动态定价策略;该策略涉及对每个节点上的资源进行精确的、依赖于状态的控制。随后证明了该策略在原始(即完全约束)系统中的性能与松弛中的性能很接近,并证明了对于spoke数和资源数以相同速率增长的大型轮辐网络,拉格朗日策略是渐近最优的。

最后,使用来自RideAustin的数据(10个月内的150万笔交易)验证了该策略在实践中的价值。

Why recommend

1、本研究创新性地考虑了网络结构,特别是中心辐射型(hub-and-spoke)网络结构对动态定价策略的影响。
2、先前的研究通常依赖于流体松弛方法来近似最优策略,这些方法在资源数量远大于需求地点数量时效果良好。但在资源和地点数量以相同速率增长的情况下,这个方法可能不再适用。本文提出了一个基于扰动的拉格朗日松弛对偶的最优策略来解决这个问题。

Optimal Growth in Two-Sided Markets

Reference: Lian, Z., & Van Ryzin, G. (2021). Optimal growth in two-sided markets. Management Science, 67(11), 6862-6879.

原文链接:https://doi.org/10.1287/mnsc.2020.3832

Problem

本文探讨了双边市场的最佳增长策略。双边市场是促进两个不同用户群体(如买家和卖家)之间互动的平台,平台增长规划的一个基本问题是平衡补贴增长的成本(通过价格或激励措施)与通过增长实现的规模经济效益。该研究所使用的模型假定市场产出(交易数量)是供需存量的函数,主要重点是确定这些市场如何在不同发展阶段(从初期扩展到成熟阶段)实现最佳增长。该研究旨在发现平台应采用的最佳定价和补贴策略,以最大限度地提高增长和效率。

Method

研究建立了一个动态模型,来描述双边市场中供给方和需求方的增长过程。该模型(monopoly model)假设一个垄断平台控制着供需价格,主要使用微分方程来捕捉价格、效用以及成本对市场增长的影响,且最佳增长政策完全取决于快速扩大规模带来的效益是否大于补贴增长的成本。首先令 s ( t ) s(t) s(t)表示时间 t t t时刻平台上的卖家数量(供给方), d ( t ) d(t) d(t)表示平台上的买家数量(需求方)。平台的目标是通过优化定价和补贴策略,最大化平台用户数的增长。模型首先给出了交易量函数 g ( s , d ) g(s, d) g(s,d)来描述给定供给和需求所获得的交易总量,并具有如下同次齐次性质:
在这里插入图片描述

接着,作者继续建立了买方和卖方的动态方程(增长方程):
在这里插入图片描述

其中, β 0 s ( t ) β_0^s(t) β0s(t) β 0 d ( t ) β_0^d(t) β0d(t)分别表示卖家和买家的自然流失率, β 1 s ( t ) β_1^s(t) β1s(t) β 1 d ( t ) β_1^d(t) β1d(t)分别决定了供给和需求增长对卖家和买家产生的剩余反应(surplus)有多强烈, w w w u u u分别为每单位供应的净卖方剩余和每单位需求的净买方剩余( p s p_s ps表示支付给卖方的交易价格, p d p_d pd表示向买方收取的交易价格;每笔交易达成后,买方获得总效用 v v v,卖方产生成本 c c c),且有:
在这里插入图片描述
在这里插入图片描述

由此,可以进一步将增长方程重写为:
在这里插入图片描述

并得出目标函数(最大化折现总利润,且折现率 ρ > 0 ρ > 0 ρ>0):
在这里插入图片描述

基于该基本模型,文章讨论了最佳市场增长行为——包括市场平衡点(临界规模)和长期稳定的市场规模(饱和规模),描述了市场增长北京下供需之间的最佳平衡,并分析出最大化折现总利润的价格设定策略。

Main Results

根据之前的模型及文中相关讨论,市场的增长速度受到供需双方的定价和补贴策略的影响。因此,作者考虑了不同的规模效应:递增规模收益、递减规模收益和恒定规模收益。

  1. 递增规模收益(Increasing Returns to Scale)
    在递增规模收益的情况下,市场初期需要积极补贴以快速达到临界质量(critical mass)。数值模拟表明,如果早期补贴不足,市场可能无法达到临界质量,导致增长停滞。模拟结果展示了在初始阶段进行大量补贴的市场能够快速达到自我维持的临界质量,从而实现可持续增长。
  2. 递减规模收益(Decreasing Returns to Scale)
    在递减规模收益的情况下,市场需要持续补贴以维持增长。模拟结果显示,即使市场达到了较大的规模,仍然需要保持一定的补贴水平以防止用户流失和市场萎缩。这种情况下,补贴策略需要精细化,以平衡增长和补贴成本。
  3. 恒定规模收益(Constant Returns to Scale)
    在恒定规模收益的市场中,市场增长对补贴的依赖较小。数值分析表明,这种市场可以通过适度的初期补贴来激发增长,尽快达到市场的饱和点(saturation point),即达到市场规模的自然限制,然后逐步减少补贴,保持稳定增长。

Why recommend

  • 本文提供了一个全面而严谨的框架、运用最优控制方法和微分方程模型来理解双边市场的增长动态,为平台经济学和最佳市场设计的更广泛文献做出了贡献。
  • 研究结果也为政策制定者提供了有价值的参考,理解双边市场中的最优增长策略有助于制定更加有效的市场监管和扶持政策,特别是在新兴平台经济和数字经济领域。

Dynamic pricing and matching in ride-hailing platforms

Reference: Yan, C., Zhu, H., Korolko, N., & Woodard, D. (2020). Dynamic pricing and matching in ride‐hailing platforms. Naval Research Logistics (NRL), 67(8), 705-724.

原文链接: https://doi.org/10.1002/nav.21872

Problem

近年来,打车平台如Uber、Lyft和DiDi在全球范围内取得了显著增长,他们将乘客与司机匹配,并根据实时供需状况进行定价。然而,这些平台在提供高质量服务的同时,面临匹配效率价格波动两个挑战。本文综述了打车平台中常用的匹配(Matching)和动态定价(Dynamic Pricing)方法,并提出了一种结合动态等待(Dynamic Waiting)机制的新方法,以减少价格波动并提高平台的整体效率。

Method

首先,文章综述了几种主要的匹配算法,以评估它们在实际应用中的有效性和局限性

  • 立即分配协议(First-Dispatch Protocol):每个请求立即分配给最近的可用司机。这种算法简单且响应快速,但在高需求时可能导致次优解。
  • 批处理匹配(Batching Matching):在一定时间窗口内收集多个请求,通过求解二部图匹配问题来优化分配。这种方法可以减少平均等待时间,提高整体效率。具体公式如下:
    在这里插入图片描述

其中,x 是匹配决策变量,r 是匹配乘客, i 和司机 j 的奖励, 约束条件确保每个乘客和司机最多匹配一次。

  • 前瞻性匹配(Forward-Looking Matching):这种方法基于对未来需求和供应的预测,通过流体线性规划等方法优化匹配决策,确保长远的系统效率,但是该方法依赖高质量的预测数据。

接着,作者指出匹配任务的复杂性来源于供需关系在时间和空间上的连续变化。为了缓解供需不平衡,打车平台通过动态定价(DP)实时调整价格,维持服务可靠性的同时减少乘客等待时间。因此,文章接着梳理了动态定价常用的两类方法,稳态模型和状态依赖动态规划。

  • 稳态模型(Steady-State Model):稳态模型基于排队论,通过分析系统在长期运行中的平均状态来优化价格和匹配决策。其核心思想是通过价格调整来平衡供需,从而防止系统进入“野鹅追逐”(WGC)状态。这种模型假设在每个时间段内供需是稳定的,不会发生剧烈变化。
    在这里插入图片描述

其中,L 为系统中的总司机数量, O 为空闲司机数量, η 为平均上车时间, Y 为单位时间内完成的行程数, T 为行程时间。通过调整价格,平台可以控制空闲司机的数量,从而影响上车时间和行程吞吐量。这使得系统能够在供需不平衡时,通过价格调整来减少需求或吸引更多司机上线,从而维持稳定的供需平衡。

  • 状态依赖动态规划(State-Dependent Dynamic Programming)

状态依赖动态规划考虑了供需在时间和空间上的动态变化,通过对未来需求和供应的预测,实时调整价格和匹配决策。其核心思想是利用时间序列数据,预测未来的供需变化,制定最优的价格调整策略,以平滑供需波动,减少价格波动。

最后,虽然动态定价在平衡供需方面非常有效,但其价格频繁波动可能导致用户体验不佳。为了进一步优化匹配效率和抑制价格波动,文章引入了动态等待机制(DW)。动态等待机制允许乘客在派单前等待一段时间,以找到更好的拼车匹配,从而减少司机需求和价格波动。当需求超过供给时,等待窗口可以增加,提高了池匹配的成功率,从而减少了司机需求,并平衡了供需关系。考虑动态等待(DW)机制之后,可以得到更新后的流量平衡方程,乘客总等待时间,乘客请求率,均衡条件和供应弹性曲线(具体公式和推导见原文)。

Main Result

本文通过使用Uber的数据进行实验,验证了动态定价(DP)和动态等待(DW)机制对打车平台性能的影响。实验的主要结论如下:

  • 行程吞吐量增加:联合优化DP和DW机制显著提高了行程吞吐量。与仅使用DP机制相比,联合使用DP和DW机制的行程吞吐量增加了约15%。
  • 车辆利用率提高:由于DW机制增加了拼车匹配的机会,车辆利用率提高了约10%。这表明,通过允许乘客在派单前等待一段时间,可以更有效地利用司机资源。
  • 乘客等待时间仅略有增加:尽管引入了等待窗口,但实际乘客等待时间仅增加了约5%。这主要是因为更高的拼车匹配率降低了上车时间,部分抵消了等待窗口带来的时间增加。
  • 价格波动减少:联合优化机制有效平滑了价格波动,使价格波动幅度减少了约20%。这有助于提高乘客和司机的满意度和参与度,减少因价格波动导致的负面体验。

Why recommend

  1. 文章不仅通过理论模型分析了动态定价和动态等待机制的有效性,还使用了来自Uber的真实运营数据进行实证研究,验证了理论模型的实际效果
  2. 文章通过均衡分析,评估了不同策略组合对平台性能的影响。这种分析不仅帮助理解了价格和等待时间之间的权衡,还提供了找到最优策略组合的理论依据。
  3. 文章开头综述了打车平台中常用的多种匹配和定价方法,并分析了这些方法的优缺点,对于想了解这一领域的读者有参考价值

参考文献:

Lian, Z., & Van Ryzin, G. (2021). Optimal growth in two-sided markets. Management Science, 67(11), 6862-6879.

Santiago R. Balseiro, David B. Brown, Chen Chen (2021) Dynamic Pricing of Relocating Resources in Large Networks. Management Science 67(7):4075-4094.

Yan, C., Zhu, H., Korolko, N., & Woodard, D. (2020). Dynamic pricing and matching in ride‐hailing platforms. Naval Research Logistics (NRL), 67(8), 705-724.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值