【时间序列分析】时间序列的预处理——平稳性检验和纯随机性检验

目录

(一)平稳性检验

平稳性的时序图检验

平稳性的自相关图检验

(二)纯随机性检验

纯随机序列的定义

白噪声序列的性质

 纯随机性检验

 原理:Barlett定理

检验统计量


(一)平稳性检验

 平稳性检验是时间序列分析中的一个重要步骤,主要用于判断时间序列数据的统计特性(如均值和方差)是否随时间变化

方法一:图检验

时序图检验

自相关图检验

方法二:构造检验统计量进行假设检验(之后的文章详细介绍)

单位根检验

平稳性的时序图检验

平稳时间序列具有常数均值和方差。这意味着平稳序列的 时序图应该显示出该序列始终在一个常数值附近波动,而且波动的范围有界的特点。

时序图:绘制时间序列的图形,通常以时间为横轴,数据值为纵轴。

观察要点

  • 趋势:若图中存在明显的上升或下降趋势,则可能是非平稳的。
  • 季节性:如果数据在特定时间间隔内表现出规律性的波动,这表明可能存在季节性。
  • 波动性:观察数据的波动幅度是否随时间变化,若波动幅度增大或减小,则可能是非平稳的。

平稳性的自相关图检验

自相关图是一一个平面二维坐标悬垂线图.横坐标表示延迟时期数,纵坐标表示自相关系数.悬垂线表示自相关系数的大小;通过分析序列与其滞后值之间的相关性来判断评估时间序列平稳性。

自相关的基本概念

  • 自相关:自相关是时间序列中当前值与其过去值之间的相关性。它量化了时间序列数据在不同时间点上的依赖性。

  • 自相关系数(ACF):表示时间序列在不同滞后数下的相关程度。自相关系数通常记作 ρ(k),其中 k 是滞后数。

解读自相关图

平稳序列

  • 自相关系数会迅速衰减,通常在滞后数的前几项内显著,之后接近零。
  • 图中大部分条形应在置信区间内。

这种行为表明当前值与过去值的关系较短期,表明数据的统计特性(均值、方差)不随时间变化

非平稳序列

  • 自相关系数可能会缓慢衰减,或在多个滞后数(例如 20 以上)上仍然显著。
  • 可能出现长期的自相关,表明数据具有趋势或季节性

这通常表示序列中存在趋势或季节性成分,说明统计特性随时间变化

虚线:2位标准差【±2/√n 的置信区间,以帮助判断自相关是否显著(其中 n是样本大小)】

(二)纯随机性检验

平稳性检验只能确定序列是否具有平稳性,但并不能保证序列中的信息是有价值的。即使一个序列是平稳的,它也可能只是一个纯随机序列,即白噪声序列。在这种情况下,历史数据不能提供关于未来的信息,此时建立时序模型将会是徒劳的。

如果序列值彼此之间没有任何相关性,那就意味着该序列是一个没有记忆的序列,过去的行为对将来的发展没有丝毫影响,这种序列称为纯随机序列.从统计分析的角度而言,纯随机序列是没有任何分析价值的序列.

纯随机序列的定义

如果序列满足如下两条性质 ,我们称该序列为纯随机序列, 也称为白噪声(WhiteNoise) 序列

简记为

$$
X_t \sim W N\left(\mu, \sigma^2\right) .
$$

(1) $E X_t=\mu, \forall t \in T$
(2) $\gamma(t, s)=\left\{\begin{array}{c}\sigma^2, t=s \\ 0, t \neq s\end{array}, \forall t, s \in T\right.$

白噪声序列的性质

 纯随机性——各序列值之间没有任何相关关系,即为 "没有记忆" 的序列

$$
\gamma(k)=0, \quad \forall k \neq 0
$$

方差齐性——序列中每个变量的方差都相等

根据马尔可夫定理,只有方差齐性假定成立时,用最小二乘法得到的未知参数估计值才是准确的、有效的

 

$$
D X_t=\gamma(0)=\sigma^2
$$

 纯随机性检验

判断一个序列是否为纯随机序列,确保序列的各项之间没有相关性

         检验自相关系数 r(k)=0(对于所有 k≠0)

理论上,纯随机序列的自相关系数应为零,但由于样本大小有限,实际计算的自相关系数可能不完全为零。故应从统计意义上判断序列的纯随机性质

 原理:Barlett定理

如果一个时间序列是纯随机的,得到一个观察期数为n的观察值序列,那么该 序列的延迟非零期的样本自相关系数将近似服从均值为零方差为序列观察期数倒数正态分布

以构造检验统计量来检验

检验统计量

1. 假设条件

  • 原假设 H0:延迟期数小于或等于 m期的序列值之间相互独立。

$$
H_0: \rho_1=\rho_2=\cdots=\rho_m=0, \forall m \geq 1
$$
  • 备择假设 Ha:至少存在某个延迟期的自相关系数不为零

$H_1$ : 至少存在某个 $\rho_k \neq 0, \forall m \geq 1, k \leq m$

2. 检验统计量

$$
Q=n \sum_{k=1}^m \hat{\rho}_k^2 \sim \chi^2(m)
$$


$$
L B=n(n+2) \sum_{k=1}^m\left(\frac{\hat{\rho}_k^2}{n-k}\right) \sim \chi^2(m)
$$

 

Q统计量:在原假设成立时,Q 统计量近似服从卡方分布,具有m 个自由度,

LB统计量(Ljung-Box统计量):在原假设成立时,LB 统计量也近似服从卡方分布,具有 m 个自由度。

3. 判别原则

  • 拒绝原假设

  • 不拒绝原假设

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值