时间序列分析分为两大类:频域分析和时域分析。频域分析也称为谱分析,是一种非常有用的纵向数据分析方法。时域分析主要关心从序列值之间的相关关系对时间序列发展规律。
在时域分析里,生成时间序列数据的随机过程按照统计规律的特征是否随着时间变化而变化分为两类,如果随机过程的特征随着时间变化,如GDP的时间序列一般随着时间稳定增长,则此过程是非平稳的;相反,如果随机过程的特征不随时间而变化,如每年相同季节的气温构成的时间序列是相似的,就称此过程是平稳的。如下图所示,左边的图表示非稳定序列,右边的图表示稳定序列。随机过程的特征有均值、方差、协方差等。随机过程的平稳性决定了将要选择的模型的基本形式,不同类型的时间序列需要不同的分析方法。
在非平稳时间序列的分析方法里,根据导致时间序列非平稳的原因是否随机,可以将它们划分为确定性时序分析和随机时序分析两大类。确定性时序分析提取信息的方法主要有趋势拟合模型、季节调整模型、移动平均、指数平滑等方法。随机时序分析提取信息的方法主要有ARIMA(autoregressive integrated moving average)及自回归条件异方差模型等。ARIMA是当前时间序列分析中最通用的方法,它是先通过差分运算,把长期趋势、固定周期等信息提取出来,将非平稳序列变为平稳序列后进行分析的过程。
下面重点介绍ARIMA及其相关的模型。