时间序列分析
时间序列也成为动态序列,是指将某种现象的指标数值按照时间顺序排列而成的数值序列。时间序列分析大致可以分为三大部分,分别是描述和过去、分析规律和预测未来。
一、基本知识
1、时间序列的基本概念
(1)时间序列也称为动态序列,是将某种现象的指标数值按照时间顺序排列而成的数值序列。
(2)时间序列分析顾名思义处理的是时间序列数据,对于同一对象在不同时间连续观察所取得的数据称作时间序列数据。例如从出生到现在你的体重数据。
(3)时间序列有两个组成要素:一个是时间要素:年、季度、月、周、日、小时、分钟、秒(如果是以分钟和秒作为时间要素,那么这类型数据称作高频数据);另一个事数值要素。
(4)时间序列有两个组成要素,可以根据这两个组成要素性质的不同,可以将其分为时期时间序列和时点时间序列两种类型的时间序列数据:
时期序列
数值要素反映现象在一定时期内发展的结果;例如,中国历年来GDP的数据
时点数据
数值要素反映现象在一定时点上的瞬间水平;例如,从出生到现在你的体重数据(每年生日称一次)、在某个地方每个一小时测得的温度数据。
那如何区分时期序列数据和时点序列数据?-- 事其序列数据可加,时点数据不可加
事其序列中的观测值反应现象在一段时期内发展的过程的总量,不同事其的观测值可以相加,相加的结果表明现象在更长的一段时间内的活动总量(就比如上面的中国历年来的GDP数据,若将两年的GDP相加,那么就代表两年内GDP的一个总的量);但是对于每个小时的温度数据,将两个小时的温度相加并没有什么意义。
(5)时间序列分解:一个时间序列数据反应某个指标数值长期变化的数值表现,所以时间序列数值变化背后必然蕴含着数值变化的规律性,而这些规律性就是时间序列分析的切入点,在通常的情况下时间序列的数值变化规律会分解为4种:
- 长期变动趋势(T):长期趋势是指统计指标在先钢厂的一段时间内,受到长期趋势影响因素的影响,表现出持续上升或者是持续下降的趋势;例如:随着国家经济的发展,人均收入将逐渐提升。
- 季节变动规律(S):季节趋势是指由于季节的转变值得指标数值发生周期性变动。这里的姐姐事广义的,一般是指以月、季、周为时间单位的,并且不能以年作为单位。例如,雪糕的销量会随着季节气温的变化而周期变化。
- 周期变动规律(C):循环变动通常以若干年为周期,这种周期变动的特征表现为增加和减少的交替出现,但是并不具严格规则的周期性连续变动。例如,市场经济的商业周期和整个国家的经济周期。
- 不规则变动(随机扰动项)I:不规则变动是指某些随机因素导致的数值变化,这些因素的作用事不可预知和没有规律性的,可以视为由于众多的偶然因素对时间序列造成的影响(就是回归种的扰动项)
2、时间序列分解模型
一个时间序列的变化可能是由上述四种变动中的一种或者是多种叠加影响而成的,四种变动与指标数值最终变动的关系可能是叠加关系,也可能是乘积关系。
时间序列分解有两种模型
-
叠加模型:如果这四种变动之间是相互独立的关系,那么叠加模型可以表示为:
Y = T + S + C + I
-
乘积模型:如果这四种变动之间存在相互影响关系,那么应该使用乘积模型:
Y = T * S * C * I
PS :Y指指标数值的最终变动;T长期趋势变动;S季节变动;C循环变动;I不规则变动
同时要注意的是:
举个例子便于理解叠加模型和乘积模型
百度指数
销售数据受季节的影响
3、时间序列分解的举例–某产品销售数据分析
第一步:导入数据,定义时间变量
第二步:做时序图
通过时序图可以得到的结论是:销量有向上的趋势,并且第二季度的销量明显高于其他季度,因此数据表现出很强的季节性。随着时间的变暖,销量数据的季节波动变化不大,因此可以