1、随机游走模型
1.1 基本介绍
随机游走模型是时间序列分析中最基本的概念,是一个著名的非平稳序列。公式如下:
式中, ut 是一个随机误差,我们通常假设它服从(0,1)的正态分布。根据公式,我们可以推导得出,随机游走模型的均值 E(Yt) 是一个常量0,不随时间变化,而方差 Var(Yt)=t×Var(u) ,随时间变化,这就说明该随机游走模型是非平稳的。很简单,这里不作推导了。
可以用R来生成一个服从随机游走模型的时间序列,代码如下:
(1)首先参考这篇博客用R生成一组随机数据的方法,具体方法如下:
# 常用随机数字
runif(n,min=0,max=1) #uniform,均匀分布
rnorm(n,mean=0,sd=1) #Gaussian(normal),正态分布
rexp(n,rate=1) #exponential,指数分布
rlnorm(n,meanlog=0,sdlog=1) #lognormal,对数正态分布
(2)然后一列全为0的数组,循环计算出每一个点,得到时间序列。最后对时间序列作平稳性检验。
x <- matrix(0, 1000, 1)
for (i in 1:1000) {
x[i+1] <- x[i] + rnorm(1)
}
plot(x, type = "l")
library(tseries)
adf.test(x)
图1 随机游走模型
1.2 衍生模型-AR(1)模型
我们在随机模型的基础上增加一个系数a,来看看时间序列是否平稳。其实这就是 AR(1) 模型,也就是说随机游走模型是AR(1)模型的特例。
(1)当 a=0 时,时间序列如下图所示
平稳性检验结果如下。p值小于0.05,在0.05的置信水平下,拒绝原假设,选择备择假设:该时间序列平稳。
> adf.test(x)
Augmented Dickey-Fuller Test
data: x
Dickey-Fuller = -9.8862, Lag order = 9, p-value = 0.01
alternative hypothesis: stationary
(2)当 a=0.5 时,时间序列如下图所示
平稳性检验结果如下。p值小于0.05,在0.05的置信水平下,拒绝原假设,选择备择假设:该时间序列平稳。
> adf.test(x)
Augmented Dickey-Fuller Test
data: x
Dickey-Fuller = -9.5753, Lag order = 9, p-value = 0.01
alternative hypothesis: stationary
(3)当 a=0.9 时,时间序列如下图所示
平稳性检验结果如下。p值小于0.05,在0.05的置信水平下,拒绝原假设,选择备择假设:该时间序列平稳。
> adf.test(x)
Augmented Dickey-Fuller Test
data: x
Dickey-Fuller = -6.4184, Lag order = 9, p-value = 0.01
alternative hypothesis: stationary
(4)当 a=1.1 时,时间序列如下图所示
很显然,该时间序列是非平稳序列。
综上所述,对于模型 Yt=a∗Yt−1+ut 而言:
当 0<a<1 时,该模型是平稳序列。
当 a>=1 时,该模型是非平稳序列。
从公式上来理解就是,
For instance, if X(t – 1 ) = 1, E[X(t)] = 0.5 ( for a = 0.5) . Now, if X moves to any direction from zero, it is pulled back to zero in next step. The only component which can drive it even further is the error term. Error term is equally probable to go in either direction. What happens when the Rho becomes 1? No force can pull the X down in the next step.
具体可以看这篇国外博客
1.3 ADF单位根平稳型检验原理
首先对公式进行变形,把
然后对 (a−1) 进行假设检验,原假设为: a−1=0 ,备择假设为: a−1!=0 ,如果p值小于0.05,拒绝原假设,就说明该时间序列是平稳的。
2、最小二乘法
2.1 最小二乘法原理
最小二乘法 (Ordinary Least Square,OLS),又称为最小平方法,是一种参数估计方法,通常用于连续变量的回归分析。
下面以一元线性回归模型的最小二乘法进行说明。假设给定了 n 个数据对