一、什么是时间序列分析?
在工作中,常常要对数据进行预测,确定业务未来的发展趋势,进而配置相关的营销策略、制定业务目标,由此引申出了一个重要的用数据预测未来的方法——时间序列分析,今天和大家分享就是实战中难度系数比较高的时间序列分析,一种根据一段时间内数据的趋势,进行预测的模型方法,实际中主要用于对销售数据、金融数据的预测。
一般来说,要对数据进行预测,需要分析时间段内数据的影响因素是哪种,这里的影响因素从科学角度来讲有四种(因为我没对时间序列分析进行过进一步的理论研究,所以和大家分享时就根据我大学专业课所学以及日常工作中的思考来讲解,欢迎批评指正):
一、长期趋势(Trend)
二、季节变化(Season)
三、循环波动(Cyclic)
四、不规则波动(Irregular)
四种影响因素通常有两种组合方式,一种是加法模型:Y=T+S+C+I,认为数据的发展趋势是4种影响因素相互叠加的结果
一种是乘法模型:Y=T*S*C*I,认为数据的发展趋势是4种因素相互综合的结果
二、如何去预测数据?
拿到一组数据,要对一组数据进行预测,通常需要如下的步骤:
1.对数据进行清洗,去掉缺失值和异常值;
2.观察数据的时序图,确定数据是否存在周期性;
3.确定数据模型(指数平滑法还是自回归移动平均);
4.对模型效果进行比对,选择最优模型;
5.对模型的预测值根据实际业务再次进行优化,得到最终结果,应用到业务当中去。
三、该用哪个预测模型?
这里我介绍两个常用的预测模型,一个是指数平滑法,一个是自回归移动平均模型。
指数平滑法的基本公式是: ,其中
- St--第t期的预测值(或指