预测模型本身会比较干巴,所以尽量多用些现实应用实例。
一开始接触预测模型算法是因为公司澳洲分发中心的人员开支超预算了。大致是这么个情况
柱状图显示的是每天发出去的订单量,蓝色是两班倒的日子,红色是周末上班的日子,绿色是普通的shift。澳洲的物流小哥每个小时正常薪资在35-50间(软妹币175到250),周末双倍,第二个shift(两班倒)则每小时加15%。具体超支多少是商业机密这儿不方便说,总之已经超到管理层肉疼了。噢对了,两班倒用的不是同一批雇员,所以另外还有一笔training cost,每个人35块一小时,要培训一周。
这张图其实已经充分说明了问题出在哪里。蓝色的柱子,高度不是应该差不多是绿色的两倍么?两班倒啊。可是并没有,事实上,histogram告诉我们,有相当一部分两班倒的日子其实完全可以用normal shift替代。
虽然mask掉了具体单量,但两张图的x轴是在同一个scale上的。大约一半的double shift其实并不必要。
经过和supply chain的director坦率而友好的交流,意识到问题的根本。物流中心是基于订单量安排人手的,而订单量的预测传统上依赖finance部门。金融会计部门的同事是怎么干的呢?拿去年的订单数据来,按照今年预期的growth,统统