企业有三大支柱职能:研发负责产品管理,设计个好产品;营销负责需求管理,卖个好价钱;供应链负责以合适的成本和速度生产出产品,将产品按期按质交付至客户。供应链虽然比较偏后台,但对很多行业来说,供应链管理水平就决定了企业是否能进一步壮大,甚至是否能存活下去。
供应链最核心的挑战点就是如何应对各个环节的不确定性。对付供应链的不确定性方式中,需求预测是应对供应链不确定性的第一道防线,预测已经是各大企业数字化、智能化转型布局中,最重要的一环。
本期文章采访阿里巴巴资深算法专家王桐,阿里巴巴在AI零售方面有着丰富的实践和经验,王桐带领预测团队对线下、线上多种供应链业务形态进行了深入的探索和实践,本期的分享围绕以下四个主题展开:
- 预测场景及特性
- 预测算法研发路线及结果
- 预测平台化输出方案
- 预测应用案例
主题1: 预测场景及特征
对于预测场景的梳理和划分,主要是基于时间轴的划分,即预测提前期。不同的预测提前期的应用和对应的算法不同。从远到近可以划分为以下几个场景。
① 测期长达一年:GMV预测
GMV预测指对店铺或者平台的成交量做长期的预测,用于制定长期的经营计划。比如营销资源,或者一些扶持成长的核心资源怎么分配,取决于对未来长期的预判。长期的预判提前期为一年,比如现在去预测下一整年行业的成交情况。
② 预测期几个月到几周:销量预测
销量预测是指预测淘宝天猫以及各个阿里系新零售的,各种场景下的商品未来销量有多少。主要用于库存补货、调拨、商品流转,业务环节中的一些核心决策都取决于我们对未来的预测判断。
③ 提前一周到几天:仓库订单量预测
仓库的来单量是很重要的不确定因素,会影响仓库的产能、人力的各种提前准备,所以这个预测需求比较迫切。
以上是预测算法的主要支持方向。这些是用离线的预测算法进行预测的(离线的定义为提前期在一天或者一天以上的),底层数据和技术体系都是离线的。
实时的有一套完整的GMV预测、销量预测、单量预测的技术方案(实时指在一天以内的),做到小时级、分钟级刷新。实时的应用场景跟离线类似,但技术架构不同。
图1-1 供应链预测场景及属性分类
在以上应用场景中,还会沿着其他的维度做细分。
① 各场景预测的目标不一样,除了销量、单量、GMV这些,还有其他的预测,所有的预测都有它的标的,都是一些未来不确定的需求,需要通过预测把不确定性尽量减小,让下游的决策能更好地执行。
② 提前期不一样,分为离线和实时,离线按年月日,实时按小时级的。
③ 分类的方式或者颗粒度怎么定,对于算法非常重要。即在做预测算法的时候,如何定义一个数据点?我们把它抽象成三个维度:
- 首先是预测对象需要做到多细。例如成交额,可以按店铺的颗粒度,做店铺的成交额,也可以是行业成交额,或者是整个天猫的成交额。同样商品的销量也有不同的粗细。这就是预测对象的粗细。
- 再者核心维度时间,即上文中的预测提前期,比如提前一年预测未来,预测未来的365天还是12个月还是52周,这是预测时间的颗粒度。
- 最后是空间,例如在淘宝天猫这个大体系下,在中国这个区域去做预测,或在华东华南这种大区做预测,或细到最细的街道层面。空间上也有不同的粗细划分方式。
以上三个不同的粗细划分方式组合起来,形成了整个预测算法的颗粒度。颗粒度的选择在很多时候是预测算法核心的决策点之一。
④ 算法产出的下游消费者是谁,可以分为两种:
- 一种是算法或者决策系统,这种对预测算法的核心要求是准确、高效率、高可用性、高稳定性;
- 一种消费方是人,做供应链计划的同学或者仓库操盘的同学,这种要求算法白盒化、可解释性高、可调整。白盒化和可解释性高是指人可以理解算法考虑的参数和没有考虑的参数,可以把人员对于业务的理解加进去,但要防止重复调整。可调整是指怎么把业务人员对事情的理解插入到算法流程中。
综上所述,供应链预测可以抽象为时间序列预测。如图1-1中预测的一个时间序列,沿着时间轴展开,会有高低起伏的趋势,在节庆日的节点会有一些爆发。比如双11,就有一个很明显的大幅度提高。所以预测算法最核心研究的是如何围绕着时间序列,来预测