使用教材:(很不错的书)
做数据分析时,很多的数据都会有时间的趋势,如销售,预测也是经常会有的工作,很多时候和时间有关的周期性变化(周,月,季度,季节性变化等)都会想到使用时间序列来做预测。
做时间序列分析,以前我自己是从网上找到别人的例子,跟着例子做,但是对其中的原理,模型的调整,得到结果的解读则不甚理解,迷迷糊糊就交差了。幸好没有被深究。
1. 时间序列的概念
时间序列模型:依时间序列排列起来的一系列观测值(观测值之间不独立),考虑的不是变量间的因果关系,而是重点考察变量在时间方面的发展变化规律,并为之建立数学模型。
另外一种理解:若我们对背后的规律探讨的十分清楚的话,本来我们是可以找到很多影响因素的,但是现在由于各种原因我们做不到这点,能做到的是用时间t代替各种因素的影响,然后去研究随着时间的变化因变量是如何变的。
使用前提:足够长的数据序列,数据序列的变动是稳定而规律的
方法分类:
时域:(Time domain) 将时间序列看成是过去一些点的函数,或者认为序列具有随时间系统变化的趋势,它可以用不多的参数来加以描述,或者说可以通过差分、周期等还原成随机序列。
频域:(Frequency domain)认为时间序列是由数个正弦波成份叠加而成,当序列的确来自一些周期函数集合时,该方法特别有用。
时间序列的构成:长期趋势+季节变化+循环变化+不规则变化
长期趋势:指一种长期的变化趋势。它采取一种全局的视角,不考虑序列局部的波动
季节变化(Season):反映一种周期性的变化一般在一年中完成
循环变化(Cyclic):指一种较长时间的周期变化。一般来说循环时间为2-15年。循环变化一般会出现波峰和波谷,呈现一种循环往复的现象。
不规则变化(error) :指时间序列中无法预计的部分,序列的随机波动 ,突发事件引起的 ,它是无法预测的 ,在分析中往往又将其称为白噪声