时 间 序 列 分 析 时间序列分析 时间序列分析
多元时间序列的分析
早期的多元时间序列分析要求输入序列和响应序列都是平稳的,这较大限制了多元时间序列在实际的运用和发展
在1987年,Engle和Granger提出了协整的概念,在协整框架下的多元时间序列分析,只要求回归的残差序列平稳
影响序列波动的因素
- 长期趋势因素(T):反映经济现象在较长时间内的发展方向,可在长时间内表现持续向上或者持续向下,或者平稳的趋势。
- 季节变动因素(S):经济现象受季节变动影响所形成的一种长度和幅度固定的周期波动。
- 循环波动因素(C):序列呈现出从低到高再从高到低的反复循环波动。
- 不规则变动因素(l):受各种偶然因素影响所形成的变动
时间序列分解常用模型
如果用x,表示序列,那x,会受(T,S,C,I,)的影响,所以可写成这种函数形式:
1.加法模型
2.乘法模型
3.伪加法模型
4.对数加法模型
使用样本自相关函数和样本偏自相关函数对模型进行识别
样本相关函数与理论相关函数是有差异的
模型识别时,应尽可能考虑多种可能的模型,通过反复尝试和删减不显著的参数,寻找合适的模型。
任何一个非平稳序列,通过适当阶数差分都可以转化为平稳序列。
时间序列分析的两个非常重要的定理
Cramer分解定理
任何一个序列的变化过程都可以被视为同时受到了确定性影响和随机性影响的作用。
非平稳序列要求这两方面的影响中至少有一方面是不稳定的
Wold定理
任何离散平稳过程{}都可以被分解为两个不相关的平稳序列之和,
其中一个为确定性的,另一个为随机性的
1.判断待测时间序列数据的平稳性和随机性
2.判断时间序列模型生成数据是否平稳,来判断时间序列模型的平稳性
3.完成模型的识别与参数估计后,应该对估计结果进行诊断和检验,以求发现所选用的模型是否合适。若不合适,应该知道下一步如何修改
模型的诊断检验
一是检验模型参数的估计值是否具有显著性(模型参数的显著性检验);
二是检验模型的残差序列是否为白噪声(模型的有效性检验或者模型的显著性检验)
模型的显著性检验:整个模型对信息的提取是否充分
模型参数的显著性检验:模型结构是否最简
平稳时间序列模型的建模过程
1.建模步骤
2.模式识别
3.参数估计
4.模型检验
5.模型优化
6.序列预测
模型优化
优化目的:选择相对最优模型。
选择模型方法:就是确定适当的比较准则,构造适当的统计量,然后根据统计量选出相对最优模型。
主要方法:
- 残差方差图定阶法
- F检验定阶法
- 最佳准则函数定阶法
模型的平稳性的统计性质:
- 均值
- 方差
- 协方差
- 自相关系数
- 偏自相关系数:在剔除了中间k-1个随机变量的干扰后,X(t-1)对Xt影响的相关度量
数 据 集 数据集 数据集
一 时间序列及分析的定义和方法
1.什么是时间序列
按照时间的顺序
把一个随机事件
变化发展的过程记录下来就构成了一个时间序列
,即按照时间顺序所收集的一组数据。
1 随机时间序列
2 观察值序列
3 随机时间序列和观察值序列的关系
观察值序列
是随机时间序列
的一次抽样过程
研究目的
揭示随机时序的性质
(揭示总体分布、边缘分布、联合分布、均值、方差等)
研究方法
通过观察值序列的性质进行推断
(通过可观测样本推断总体参数或者分布)
2.什么是时间序列分析
对时间序列进行观察、研究,寻找
变化发展的规律
,预测
它将来的走势
就是时间序列分析。即 时间序列分析就是对时间序列进行统计分析。
随机抽样–》观察值序列–》分析–》规律–》对原本的随机时间序列进行推断
3.时间序列分析方法
1 描述性时序分析
通过直观的数据比较或绘图观测,寻找序列中蕴含的发展规律。
特点:简单有效
局限:过于主观,展示明显规律
2 统计时序分析
基于数理统计学的基本原理来分析时间序列内在的相关关系。
20世纪20年代,开始,到现在已经是21世纪,发展了近百年
特点:严谨科学
2.1 频率分析方法-频谱分析和谱分析方法
原理
假设任何一种无趋势的时间序列都可以分解成若干不同频率的周期波动。
发展过程
早期的频域分析方法借助傅里叶分析从频率的角度揭示时间序列的规律;
后来借助了傅里叶变换,用正弦、余弦项之和来逼近某个函数;
20世纪60年代,引入最大嫡谱估计理论,进入现代谱分析阶段。
特点
非常有用的动态数据分析方法,但是由于分析方法复杂,结果抽象,有一定的使用局限性。
2.2 时域分析方法(主流方法)
主要是从序列自相关的角度揭示时间序列的发展规律。
特点
理论基础扎实、操作步骤规范、分析结果易于解释。
基本思想
事件的发展通常都具有一定的惯性,这种惯性用统计的语言来描述就是序列值之间存在着一定的相关关系,且这种相关关系通常具有某种统计规律。
分析目标
寻找出序列值之间相关关系的统计规律,并拟合出适当的数学模型来描述这种规律,进而利用拟合模型
预测序列未来的走势。
一般步骤
- 1.考察观察值序列的特征
- 根据序列的特征选择适当的拟合模型
- 根据序列的观察数据确定模型的口径
- 检验模型,优化模型
- 利用拟合好的模型推断序列其它的统计性质或预测序列将来的发展
二 时间序列的预处理
1.平稳性检验
1 特征统计量
一个随机变量的统计特征可以由它的分布函数或者密度函数来决定。
随机变量族{X}的所有统计特性完全由它们的联合分布函数或联合密度函数决定。
2 平稳时间序列的定义
3 平稳时间序列的统计性质
4 平稳时间序列的意义
5 平稳性的检验
2.纯随机性检验
补充 专业名词
拖尾性
截尾性
1.随机游走(Random Walk)
2.平稳性
- 严平稳
- 弱平稳
- 非严非弱平稳
3.自相关
4.偏自相关
5.白噪声
均值为0 ,且不自相关的随机序列
6.回归模型
7.自回归模型
8.动态回归模型
9.趋势
10.季节性
11.周期性
12.独立同分布
独立同分布(iid,independently identically distribution)在概率统计理论中,指随机过程中,任何时刻的取值都为随机变量,如果这些随机变量服从同一分布,并且互相独立,那么这些随机变量是独立同分布。独立同分布最早应用于统计学,随着科学的发展,独立同分布已经应用数据挖掘,信号处理等不同的领域。
13.时间序列:(可分为)信号序列/系统部分(systematic)+噪声序列/非系统部分(non-systematic)
14.信号序列(系统部分)可分:水平向(Level)+趋势向(Trend)+季节向(Seasonality)
15.噪声序列/非系统部分:噪声
16.AR:自回归模型(AutoRegressive Models)
17.MA: 滑动平均模型(Moving Average Models)
18.ARMA:自回归滑动平均模型(AutoRegressive Moving Average Models)
19.四种常用的回归模型:
-
Regressive model:回归模型
-
Autoregressive model(AR):自回归模型
-
Distributed Lag model(DL):分布滞后莫模型
-
Autoregressive Distributed Lag model(ADL):自回归分布滞后莫模型
20.滞后算子(back-shift operator)
二 时间序列建模的一般过程
所有的模型都是错的,但是有一些是有用的
- 模型设定
- 参数估计
- 模型检验和模型选择