时间序列是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。
时间序列分析的主要目的是根据已有的历史数据对未来进行预测。与面板数据不同,面板数据侧重于同一时间点不同样本的数值,而时间序列侧重于同一统计指标在时间的不同点的数值。时间序列有两个重要指标,一个是资料所属的时间,另一个是时间上的统计指标数值。时间序列可以描述社会经济现象在不同时间的发展状态和过程,也可以根据历史数据进行合理的未来推测。
时间序列分析是根据已有的时间序列历史数据,通过曲线拟合和参数估计(例如最常见的非线性最小二乘法)来建立数学模型的理论和方法。时间序列分析多见于国民经济、股票市场、市场潜力预测、灾害防治、气候管理等各个方面。
AR自回归模型
自回归模型(英语:Autoregressive model,简称AR模型),是统计上一种处理时间序列的方法,用同一变数例如x的之前各期,亦即x1至xt-1来预测本期xt的表现,并假设它们为一线性关系。因为这是从回归分析中的线性回归发展而来,只是不用x预测y,而是用x预测 x(自己);所以叫做自回归。
自回归模型描述当前值与历史值之间的关系,用变量自身的历史时间数据对自身进行预测。自回归模型必须满足平稳性的要求。
自回归模型首先需要确定一个阶数p,表示用几期的历史值来预测当前值。p阶自回归模型的公式定义为:
AR模型:在t时刻的随机变量X ( t ) 的取值x ( t ) 是关于过去p期x ( t − 1 ) ,x ( t − 2 ) ,x ( t − 3 ) ,… 多元线性回归。认为x ( t ) 主要受到过去p时间的影响。误差项ε(t)是当期的随机扰动。
MA模型:在t时刻的随机变量X ( t ) 的取值x ( t ) 是关于过去q期随机扰动项x(t−1),x ( t − 2 ) ,x ( t − 3 ) … 多元线性回归。认为x ( t ) 主要受到过去q时间随机扰动的影响。μ 是Xt的均值。(有限阶的MA模型一定是平稳的)
在这里解释一下随机扰动:是指X ( t ) 的波动不确定的部分,我们就用无穷阶的AR模型来表示。
ARMA模型:在t时刻的随机变量X ( t 的取值x ( t )是关于过去p期x ( t − 1 ) ,x ( t − 2 ),x ( t − 3 ) ,…和过去q期随机扰动项ε ( t − 1 ) ,ε ( t − 2 ) ,ε ( t − 3 ) ,… 的多元线性回归。
自回归模型有很多的限制:
1、自回归模型是用自身的数据进行预测
2、时间序列数据必须具有平稳性
3、自回归只适用于预测与自身前期相关的现象
移动平均模型MA
移动平均模型关注的是自回归模型中的误差项的累加 ,q阶自回归过程的公式定义如下:
移动平均法能有效地消除预测中的随机波动。
自回归移动平均模型ARMA
自回归模型AR和移动平均模型MA模型相结合,我们就得到了自回归移动平均模型ARMA(p,q),计算公式如下:
ARMA模型需要对时间序列的随机性和平稳性进行检验,根据检验的结果,可将序列分为不同的类型:
纯随机序列(白噪声序列):序列的各项之间没有任何的相关关系,序列在进行完全无序的波动,对于这样的序列,ARMA选择放弃分析。
平稳非白噪声序列:平稳的意思指该序列的均值和方差是常数,对于该类型的数据,我们通常建立一个线性拟合该序列的发展,比如使用ARMA。
非平稳序列:它的均值和方差不稳定,处理方法一般是将其转化为平稳性数据,然后再使用ARMA算法。
代码
=========================================================================
ARCH模型,全称“自回归条件异方差模型”
在现代高频金融时间序列中,数据经常出现波动性聚集的特点,但从长期来看数据是平稳的,即长期方差(无条件方差)是定值,但从短期来看方差是不稳定的,我们称这种
异方差为条件异方差。传统的时间序列模型如ARMA模型识别不出来这一特征。
ARCH模型认为模型的序列值波动与其过去p期的波动有关。模型表达式为:
单位根时间序列检验
检验
在建立时间序列的模型后,我们要对时间序列数据进行多重检验,以确定该数据符合我们的统计学上的分析准则。主要的检验要观察数据的自相关性,阶数识别和单位根检验(ADF检验)。