SPSS分析技术:时间序列分析的ARIMA模型;考虑各种促销因素的服装销售额预测

基础准备

学习积累的过程,是量变到质变的过程。草堂君在前面介绍了时间序列分析的多篇文章,这些文章的安排都是按照循序渐进学习时间序列分析的过程来安排的,大家可以点击下方的链接回顾:


上篇文章介绍了AR/MA/ARMA/ARIMA模型体系,这些模型适用于不同的时间序列情形,但是有一个共同点,它们分析时间序列的方式都是从时间序列数值本身的相关关系角度出发,力求建立起前期数据与当期数据之间的回归方程。在SPSS中,该模型体系都是综合在ARIMA模型菜单之下的,可以这样理解,ARIMA包含了AR、MA、ARMA和差分的成分,可以根据不同的时间序列情况,选择不同的模型。


ARIMA模型

ARIMA模型也称为差分自回归移动平均模型,从名字就可以看出,该模型包含了AR、MA、ARMA和差分的成分,能过用于分析更复杂的带有长期趋势的时间序列。


前面介绍过,差分功能用于解决时间序列包含长期趋势的非平稳情况,通过差分,可以将部分非平稳的时间序列转换成平稳时间序列一般线性长期趋势,用一阶差分;二次曲线的长期趋势,用二次差分,这里差分的阶数用d表示。时间序列平稳化后,再根据平稳化后的时间序列情况选用AR(p)、MA(q)或ARMA(p,q)模型进行分析。至于使用哪种模型,以及如何确定自回归阶数p,移动平均阶数q,则需要通过不断尝试,看看哪种模型的拟合效果最好来确定,这在以前计算机运算能力不强以及统计分析软件未开发之前是很难实现的,随着时代的发展,这些困难在今天都已经不是阻碍。

 

确定ARIMA模型参数p,d,q的方法有两种:第一种是通过分析者对时间序列的充分了解,根据长期趋势确定差分次数d,将时间序列平稳化,然后再使用自回归函数图确定滑动平均过程的阶数q,用偏自回归函数图确定自回归过程的阶数p;第二种是直接使用拟合效果的信息准则法确定阶数,这里的信息准侧有AIC(赤池信息准则)和BIC(贝叶斯信息准则),它们的分析原理都是拟合残差最小的阶数p和q就是最合适的。

 

第一种确定模型参数p,d,q的方法要求分析者对时间序列的数据背景,以及ARIMA模型原理都非常熟悉,才能够确定出合适的参数结果;第二种方法则可以借助SPSS等统计分析软件快速尝试各种p,d,q的数值组合,然后比较AIC或BIC确定最终的ARIMA模型参数。


以上两种方法各有利弊,第一种方式因为建立在充分了解数据和原理的基础之上,因此结果一般都更为精准,但是比较花时间;第二种方式则借助计算机软件帮助,可以快速出结果,但是可能会遗漏一些重要信息,结果会稍有偏差。当然最好是在分析的过程将两种方法结合使用,先用计算机快速获得结果,再对该结果进行改进确认。


在SPSS软件中,提供了以上两种确定ARIMA模型参数的所有工具。如下图所示,序列图功能可以帮助分析者了解时间序列包含的变动成分,如果有季节变动成分,可以使用季节性分析菜单将四种变动成分分解。然后再用自相关菜单做出自相关函数图和偏自相关函数图来判断参数p和q。最后在创建传统模型里面选择右图的ARIMA方法,点击条件,填入分析者基于以上过程获得的参数p,d,q,拟合模型。

第二种确定ARIMA模型参数的方法可以直接选择上方右图的专家建模器,输入时间序列数据,计算机将自动快速拟合比较模型结果,确定出模型的参数p,d,q,这种方法更加简洁快速。下面草堂君将用一个具体的案例来教大家如何使用专家建模器对时间序列进行分析并作出下一年指标数值的预测。


案例分析

我们继续使用指数平滑模型文章的案例,数据中增添了几项新的营销变量,包括宣传费用、销售人员数量、订购电话数量、宣传材料页数和邮寄数等,这些促销信息都可以作为自变量纳入模型。在国家大众创业、万众创新的宣传口号下,很多漂在大城市的人们都动起回乡创业的信息。小童和小吴是一对普通的北漂夫妻,在巨大生活压力下,他们想回乡发展。因为家中有亲戚做服装生意,所以他们打算在家开服装店。由于小童原来的职业是快速消费品销售,因此他首先从亲戚处获取了近10年的销售数据,期望分析后能够对今后的销售策略有所帮助。下图是整理好销售数据:


分析思路

在指数平滑模型文章中,我们已经通过时间序列图知道,如下图所示,男装的的销售额是包含季节变动成分的,同时还有长期增长的趋势,因此我们尝试用ARIMA模型来分析该时间序列是同样需要考虑季节变动成分。

此外,需要强调的是,指数平滑模型由于只涉及时间序列的分解,因此不能将其它的自变量如何模型一起考虑。而ARIMA模型是用回归模型对时间序列进行拟合分析的,因此可以将其它变量纳入模型一起考虑,这也是ARIMA模型比指数平滑等变动分解模型更为常用和高级的地方。


分析步骤

1、选择菜单【分析】-【时间序列预测】-【创建传统模型】,在跳出的对话框中将男装销售选为因变量,将宣传营销手段的因素选为自变量;在方法中选择专家建模器(自动根据实际情况确定参数)。

2、点击方法边上的【条件】按钮,模型类型选择仅限ARIMA模型,同时将考虑季节性模型选项选中,可以发现系统自动检测数据后得到季节变动周期为12;特别强调一下,这里的事件自变量是指二元自变量,比如水灾罢工等,发生记为1,没发生时记为0,本案例中的自变量都不是事件自变量,所以不用选。 

3、点击左上角的统计按钮,将要输出的模型效果统计量选中。在拟合指标中,选择平稳R方,再将拟合优度选中。其它选项可以根据需要选择。

4、点击左上角的图按钮,输出序列图。序列图中包括实测值、预测值和拟合值,这样能够方便分析者直观判断生成模型的拟合效果。

5、点击【确定】,输出结果。


结果解释

1、ARIMA模型结果。这里的差分自回归移动平均模型包括六个参数:ARIMA(p,d,q)(P,D,Q),p和P代表自回归过程的阶数;d和D代表差分次数;q和Q代表移动平均过程阶数。小写的p,d,q代表不包含季节变动成分的ARIMA模型结果,大写的是包含季节变动成分的模型结果。因为本案例的时间序列是包含季节变动成分的,所以看后面括号的结果。可以发现时间序列经过一次差分,自回归过程阶数为1。


2、模型拟合效果。可以发现平稳R方达到0.734,考虑季节变动的整体R方为0.840,说明SPSS自动计算生成的ARIMA(0,0,0)(1,1,0)模型的拟合效果是很不错的。最后的BIC值仅有16.027,同样说明模型的拟合效果很好。


3、拟合效果图。上图是用ARIMA模型进行时间序列拟合的结果,下图是原来用指数平滑模型进行拟合的结果。对比后可以发现,ARIMA模型更为准确,例如图上标注的区域,指数平滑模型没有拟合成功,而考虑和自变量后的ARIMA模型则能够准确的拟合。


4、拟合效果说明。所有涉及到回归方程(模型)的分析技术,其分析结果都没有对或错之分,只有不好、好和更好的区别,整个建模过程就是一个不断优化的过程,这也是数据分析的魅力所在。套用一句广告词:没有最好,只有更好。


总结一下

ARIMA分析模型与前面介绍的时间序列分解模型不同,它从时间序列数值本身的相关性出发,力求建立回归模型,这样不仅能够充分利用时间序列数值变化信息,而且能够便捷的将其它影响因素纳入模型进行考虑,这是更为精细的时间序列分析方法。草堂君在写这篇文章之间,考虑了很久,应该如何省略ARIMA模型的大篇幅公式推导,而从宏观上用通俗的语言来介绍这种模型。纸上得来终觉浅,大家在看完文章,思考后,如果有什么疑问,可以在下面获得草堂君的联系方式,进行交流咨询。


所有例题的数据文件都会上传到QQ群中,需要对照练习的朋友可以前往下载,QQ群号见下方温馨提示。生活统计学不仅有各种数据分析方法,更有容易被大家忽视的生活常识。


温馨提示:

  • 数据分析课程私人定制,一对一辅导,添加微信(possitive2)咨询!

  • 生活统计学QQ群:134373751,用于分享文章提到的各种案例资料、软件、数据文件等。支持各种资料的直接下载和百度云盘下载。

  • 生活统计学微信交流群,用于各自行业的数据研究项目及其成果交流分享;由于人数大于100人,请添加微信possitive2,拉您入群。

  • 数据分析咨询,请点击首页下方“互动咨询”板块,获取咨询流程!

©️2020 CSDN 皮肤主题: 大白 设计师:CSDN官方博客 返回首页