时序模式
时序模式是指通过时间序列搜索出的重复发生概率较高的模式。与回归一样,它也是用己知的数据预测未来的值,但这些数据的区别是变量所处时间的不同。
1.时间序列的预处理
到一个观察值序列后,首先要对它的纯随机性和平稳性进行检验,这两个重要的检验称为序列的预处理。根据检验结果可以将序列分为不同的类型,对不同类型的序列会采用不同的分析方法。
对于纯随机序列,又叫白噪声序列,序列的各项之间没有任何相关关系,序列在进行完全无序的随机波动,可以终止对该序列的分析。白噪声序列是没有信息可提取的平稳序列。
对于平稳非白噪声序列,它的均值和方差是常数,现已有一套非常成熟的平稳序列的建模方法。通常是建立一个线性模型来拟合该序列的发展,借此提取该序列的有用信息。ARMA模型是最常用的平稳序列拟合模型。
对于非平稳序列,由于它的均值和方差不稳定,处理方法一般是将其转变为平稳序列,这样就可以应用有关平稳时间序列的分析方法,如建立ARMA模型进行相应的研究。如果一个时间序列经差分运算后具有平稳性,称该序列为差分平稳序列,可以使用ARIMA模型进行分析。
2.平稳性检验
1)平稳时间序列的定义
对于随机变量X,可以计算其均值(数学期望)u、方差;对于两个随机变量X和Y,可以计算X,Y的协方差=E[(X-ux)(Y-uy)]和相关系数= cov(X,Y)/,它们度量了两个不同事件之间的相互影响程度。
对于时间序列任意时刻的序列值Xt都是一个随机变量,每一个随机变量都会有均值和方差,记Xt的均值为ut,方差为任取t,s,定义序列的自协方差函数=E[(xt-ut)(Xs-us)]和自相关系数,之所以称它们为自协方差函数和自相关系数,是因为它们衡量的是同一个事件在两个不同时期(时刻t和时刻s)之间的相关程度,形象地讲就是度量子集过去的行为对自己现在的影响。
如果事件序列 在某一常数附近波动且波动范围有