本文摘自以上书籍,作者:刘宝红,京东、当当有售。
预测模型的选择是个复杂过程,需要考虑多方面的因素,再配以职业判断。计划软件往往按照特定的指标判断预测模型的优劣,但很难综合考虑多种因素,特别是历史数据没有反映的信息。这就是对计划软件建议的模型,有经验的计划人员总是戒心重重的原因了。
在选择合适的预测模型时,我们首先要看预测准确度。前面说过,常用的准确度指标有两个:绝对误差百分比、均方差。前者的好处是直观,但有可能误导;后者的好处是更能够避免极端误差,但不直观。
我还看到,有人用预测“成功率”来评判模型的好坏。比如准确度目标是70%或更高,选100个样本,用预测方法A,有60个样本达到70%以上的准确度;用方法B,只有55个,所以就得出A优于B的结论。这看上去有道理,但如果A没有预测“准”的产品中,误差极端大的案例很多;而B没有预测“准”的产品中,误差都相对挺小,怎么办?
我们当然希望更多的产品能够预测更准;但害死我们的是那些预测极端不准的,这在上面评判方法中没有覆盖到。打个不恰当的比喻,这有点像木桶理论,每个桶板当然是越长越好,但真正害死我们的是那些最短的板。
所以,围绕多个产品选择一种更优的预测方法