目录
1.时间序列分析
时间序列的定义:
在统计研究中,常用按时间顺序排列的一组随机变量 X 1 , X 2 , . . . , X t . . . X_1,X_2,...,X_t... X1,X2,...,Xt...来表示一个随机事件的时间序列,简记为 { X t } . \{ X_t \}. {
Xt}.
用 x 1 , x 2 , . . . , x t x_1,x_2,...,x_t x1,x2,...,xt或 { x t } . \{ x_t \}. {
xt}. 表示该随机序列的n个有序观测值。
两种时间序列的分析方法:
(1)描述性时序分析
通过直观的收集到的数据作比较或绘图观测分析,寻找序列中蕴含的发展规律。
(2)统计时序分析
因为随机变量通常会呈现出很强的随机性,想通过对序列简单的观察和描述总结出随机变量发展变化的规律并准确的预测出他们将来的走势通常是非常困难的。
故学术界利用数理统计学原理分析时间序列。研究的重心从总结表面的现象转移到分析序列值内在的相关关系上。
分为频域分析方法(频谱分析或谱分析)和时域分析方法
早期的频域分析方法假设任何一种无趋势的时间序列都可以分解成若干不同频率的周期波动。谱分析的方法具有很大的局限性。
时域分析方法主要是从序列自相关的角度揭示时间序列的发展规律。其理论已相当成熟。
2.时间序列的预处理
平稳性检验
平稳性是某些时间序列具有的一种统计特征。分为严平稳和宽平稳(弱平稳或二阶平稳)。在实际应用中,研究最多的是宽平稳随机序列。宽平稳是用序列的特征统计量(均值、方差、自相关系数)来定义的。
方法一:借助R绘制时序图,可主关判断时间序列的平稳性。
yield <- ts()
plot(yield)
判断标准:平稳序列的时序图应该显示出该序列始终在一个常数值附近波动而且波动范围有界。如果时序图显示出该序列有明显的趋势性或周期性,则他通常是不平稳的时间序列。
方法二:自相关图检验
acf()
判断标准:随着延迟期数k的增加,平稳序列的自相关系数会很快地衰减向零。反之,非平稳序列的自相关系数衰减向零的速度通常比较慢。
方法三:单位根检验(是最常用的客观的统计检验方法)
R中的fUnitRoots程序包中的adfTest函数可进行单位根检验,基于DF统计量检验。只适用于AR(1)
adfTest(x,lags=,type=)
ADF统计量检验:
adftest(x)
当P值小于事先给定的显著性水平时,认为序列是平稳的。否则,为非平稳
纯随机性检验(白噪声检验)
Box.test(x,type=,lag=)
# type是检验统计量的类型
#type=“Box-Pierce”系统默认输出白噪声检验的Q统计量
#type="Ljung-Box",输出白噪声检验的LB统计量
如果P值小于显著性水平,则认为序列为非白噪声。否则,视为白噪声,即该序列没有任何规律可循,停止对该序列的统计分析。
3.平稳时间序列分析
方法性工具
差分运算
k步差分
延迟算子B
线性差分方程
ARMA模型
ARMA全称为自回归移动平均模型。分为AR,MA,ARMA三大类。
R中常用的三个拟合模型:
library(zoo)
library(forecast)
arima.sim()
filter()
auto.arima()
前两个函数需要根据自相关系数、偏自相关系数表现出的拖尾截尾性质自行给模型定阶,而第三个函数,R会根据aicc或aic或bic信息量最小原则自动定阶。
平稳序列建模
建模步骤
样本自相关系数与偏自相关系数
时间序列经过平稳非白噪声处理后,求出自相关系数和偏自相关系数,利用其性质选择合适的模型拟合观察值序列。
模型 | 自相关系数 | 偏自相关系数 |
---|---|---|
AR§ | 拖尾 | p阶截尾 |
MA(q) | q阶截尾 | 拖尾 |
ARMA(p,q) | 拖尾 | 拖尾 |
模型识别
利用上述表格中自相关系数与偏自相关系数表现出的性质可进行主观经验的定阶。
如果样本自相关系数或偏自相关系数在最初的d阶明显超过2倍标准差范围,而几乎95%的自相关系数都落在2倍标准差的范围以内,而且由非零自相关系数衰减为小值波动的过程非常突然,这时,通常视为自相关系数截尾,截尾阶数为d。
如果有超过5%的样本自相关系数落入2倍标准差范围之外,或者由显著非零的自相关系数衰减为小值波动的过程比较缓慢或者非常连续,这时,通常视为自相关系数不截尾。
参数估计
位置参数的三种估计方法:矩估计、极大似然估计、最小二乘估计
arima(x, order=, include.mean=, method=)
#method="CSS-ML",默认的是条件最小二乘与极大似然估计混合方法
#method="ML",极大似然估计
#method="CSS",条件最小二乘估计
模型检验
一、模型的显著性检验
所谓模型的显著性检验即为残差序列的白噪声检验。若拟合模型有效,则在拟合残差项中不再含有任何相关信息,即残差序列应该为白噪声序列。这样的模型称为显著有效模型。
原假设和备择假设分别为:
H 0 : ρ 1 = ρ 2 = . . . ρ m = 0 , ∀ m ≥ 1 H_0:\rho_1=\rho_2=...\rho_m=0,\forall m \geq 1 H0:ρ1