时间序列分析(1):前言

目录

第1章 时间序列分析简介

1.1 时间序列的定义

1.2 时间序列分析方法

1.2.1 描述性时序分析

1.2.2 统计时序分析

第2章 时间序列的预处理

2.0 对预处理的理解

2.1 平稳时间序列的定义

2.1.1 特征统计量

2.1.2 平稳时间序列的定义

2.1.3 平稳时间序列的统计性质

2.2 平稳性检验

2.2.1 时序图检验

2.2.2 自相关图检验

2.3 纯随机性检验

2.3.1 纯随机序列的定义

2.3.2 纯随机序列的性质

2.3.3 纯随机性检验


第1章 时间序列分析简介

1.1 时间序列的定义

时间序列:按时间顺序排列的一组随机变量eq?%5C%7B%7BX_%7B1%7D%2CX_%7B2%7D%2C%5Cldots%2CX_%7Bt%7D%2C%5Cldots%7D%5C%7D,其对应的观察值序列为eq?%5C%7B%7Bx_%7B1%7D%2Cx_%7B2%7D%2C%5Cldots%2Cx_%7Bn%7D%7D%5C%7D

时间序列的目的:通过观察值序列eq?%5C%7B%7Bx_%7Bt%7D%7D%5C%7D的性质推断随机时间序列eq?%5C%7B%7BX_%7Bt%7D%7D%5C%7D的性质。

1.2 时间序列分析方法

1.2.1 描述性时序分析

定义:通过直观的数据比较或绘图观测,寻找序列中蕴含的发展规律。
特点:操作简单、直观有效、时序分析的第一步
局限:主观性,只能展示非常明显的规律性。 例如,对于汇率的波动,描述性时序分析无法总结出波动的变化规律,无法准确预测汇率将来的走势。

1.2.2 统计时序分析

一、频域分析法

原理:假设任何一种无趋势的时间序列都可以分解成若干不同频率的周期波动

特点:非常有用的动态数据分析方法

局限:分析方法复杂,结果抽象

二、时域分析法

原理:事件的发展通常都具有一定的惯性,这种惯性用统计的语言来描述就是序列值之间存在着一定的相关关系,这种相关关系通常具有某种统计规律。

目的:寻找出序列值之间相关关系的统计规律,并拟合出适当的数学模型来描述这种规律,进而利用这个拟合模型预测序列未来的走势

特点:分析结果易于解释,是时间序列分析的主流方法

步骤

1.考察时序图观察值序列的变化特征(相关关系)
2.根据序列的特征选择适当的拟合模型
3.根据序列的观察数据确定模型的口径(估计模型)
4.检验模型,优化模型
5.利用拟合好的模型来推断序列其它的统计性质或预测序列将来的发展

第2章 时间序列的预处理

2.0 对预处理的理解

Q1: 预处理包含哪些工作?

A1: 包含平稳性、纯随机性检验。

        平稳性检验:检验序列是否平稳,将序列分为平稳和不平稳两类;

        纯随机性检验:检验序列是否存在相关信息。


Q2: 为什么要进行预处理?

A2: 因为需要将不同的时间序列分为不同类型,对不同类型的时间序列用不同的分析方法。进一步解释,不做预处理会出现下面这些问题:

(1)对非平稳数据通过经典的因果关系的回归模型进行分析可能会违背经典假定,这样一般不会得到有意义的结果,比如:伪回归现象;

(2)不存在相关性的序列没有研究价值,不能做预测应用。


Q3:预处理将时间序列分成了哪几类?

A:

2.1 平稳时间序列的定义

2.1.1 特征统计量

        为了描述时间序列的平稳性,需要一下几个概念:概率分布、均值、方差、自协方差、自相关系数。

一、概率分布

概率分布的意义:随机变量族eq?%5C%7B%7BX_%7Bt%7D%7D%5C%7D所有统计特性完全由它们的联合分布函数(或联合密度函数)决定。

时间序列概率分布族:时间序列的概率分布族定义为其所有有限维分布函数构成的全体,                                                                                                                 ​​​​​                                                eq?%5Cbegin%7Baligned%7D%20%26%5C%7BF_%7Bt_%7B1%7D%2Ct_%7B2%7D%2C%5Ccdots%2Ct_%7Bm%7D%7D%28x_%7B1%7D%2Cx_%7B2%7D%2C%5Ccdots%2Cx_%7Bm%7D%29%5C%7D%3DP%28X_%7Bt_%7B1%7D%7D%20%5Cleq%20x_%7B1%7D%2C%5Ccdots%2Cx_%7Bt_%7Bm%7D%7D%20%5Cleq%20X_%7Bm%7D%29%20%5C%5C%20%26%5Cforall%20m%5Cin%281%2C2%2C%5Ccdots%2Cm%29%2C%5Cforall%20x_1%2C%5Ccdots%2Cx_m%5Cin%28-%5Cinfty%2C+%5Cinfty%29%2C%20%5C%5C%20%26%5Cforall%20t_1%2Ct_2%2C%5Ccdots%2Ct_m%5Cin%20T%20%5Cend%7Baligned%7D

           例如:时间序列的所有一维分布(m=1)是:
eq?F_%7Bt_1%7D%5Cleft%28x_1%5Cright%29%2CF_%7Bt_2%7D%5Cleft%28x_2%5Cright%29%2CF_%7Bt_3%7D%5Cleft%28x_3%5Cright%29%2C%5Ccdots
           所有二维分布(m=2)是:
eq?F_%7Bt_1%2Ct_2%7D%5Cleft%28x_1%2Cx_2%5Cright%29%2CF_%7Bt_1%2Ct_3%7D%5Cleft%28x_1%2Cx_3%5Cright%29%2C%5Ccdots%20F_%7Bt_2%2Ct_3%7D%5Cleft%28x_2%2Cx_3%5Cright%29%2C%5Ccdots
           所有三维分布(m=3)是:

eq?F_%7Bt_1%2Ct_2%2Ct_3%7D%5Cleft%28x_1%2Cx_2%2Cx_3%5Cright%29%2C%5Ccdots

时间序列概率分布族的局限 由于分布函数族的复杂性,通常得不到这些分布函数。
二、均值

均值函数:反映了时间序列在时刻 t 的平均水平。

eq?%5Cmu_t%20%3D%20EX_t%20%3D%20%5Cint_%7B-%5Cinfty%7D%5E%5Cinfty%20xdF_t%28x%29%20%3D%20%5Cint_%7B-%5Cinfty%7D%5E%5Cinfty%20x%5Cmathrm%7Bf%7D_t%28x%29dx

特点:均值和时间 t 有关系,因为每个时间点都是一 个随机变量。

三、方差

方差函数:反映了序列在时刻 t 偏离平均水平的程度。

eq?DX_t%3DE%28X_t-%5Cmu_t%29%5E2%3D%5Cint_%7B-%5Cinfty%7D%5E%5Cinfty%28x-%5Cmu_t%29%5E2dF_t%28x%29

特点:方差和时间 t 有关系,因为每个时间点都是一个随机变量。(横向波动)

四、自协方差

自协方差函数:反映了两个随机变量之间的相关性,如果自协方差>0,表示正相关,=0表示不相关,<0代表负相关;但是自协方差的具体数值不能反应变量间相关程度(与变量的量纲有关系)

eq?%5Cbegin%7Baligned%7D%26%5Coperatorname%7Bcov%7D%28X_t%2CX_s%29%20%3D%20%5Cgamma%28t%2Cs%29%20%3D%20E%28X_t%20-%20%5Cmu_t%29%20%28X_s%20-%20%5Cmu_s%29%3DE%28X_tX_s%29-%5Cmu_t%5Cmu_s%5Cend%7Baligned%7D

特点:协方差和时间 t,s都有关系(纵向波动)

五、自相关系数

自相关系数函数:反映 了两个随机变量之间的线性相关性,如果自相关系数>0,表示正线性相关,=0表示不相关,<0代表负线性相关;自相关系数的具体数值可以反应变量间线性相关程度的(与变量的量纲没有关系)。

eq?%5Crho%28t%2Cs%29%3D%5Cfrac%7B%5Cgamma%28t%2Cs%29%7D%7B%5Csqrt%7BDX_t%5Ccdot%20DX_s%7D%7D

特点:自相关系数和时间 t,s都有关系,取值范围【-1,1】区间。

2.1.2 平稳时间序列的定义

一、严平稳

定义:只有当序列所有的统计性质都不会随着时间的推移而发生变化时,该序列才能被认为平稳。

缺点:要想获得随机序列的联合分布式一件非常困难的事,所以严平稳时间序列只有理论意义

二、宽平稳

定义:序列的统计性质主要由它的低阶矩决定,所以只要保证序列低阶矩平稳(二阶),就能保证序列的主要性质近似稳定。

满足如下三个条件的序列称为宽平稳序列:
(1)方差相同且有界
(2)均值为常数
(3)自相关系数和自协方差只与时间间隔有关,与时间 t 和 s 无关。
三、严平稳与宽平稳的关系

宽平稳一般不是严平稳,严平稳也不一定是宽平稳的。

(1)不存在低阶矩(低阶矩等于无穷)的严平稳序列不满足宽平稳条件;
(2)平稳序列=宽平稳序列=弱平稳序列;
(3)当序列所有时间点的序列值服仍正态分布时,宽平稳可以推出严平稳。

2.1.3 平稳时间序列的统计性质

自相关系数的四个性质:
(1)规范性;(2)对称性;(3)非负定性;(4)非唯一性

Q: 多个时间序列建模要求每个序列平稳是因为伪回归。单一时间序列建模为什么要求平稳?

A:平稳性实际上是对不同时刻的序列值做了同分布的假定,所有均值、方差都一样。由于平稳性,每一个统计量都将拥有大量的样本观察值。这极大地减少了随机变量的个数,增加了待估变量的样本容量。极大地简化了时序分析的难度,同时也提高了对特征统计量的估计精度。

2.2 平稳性检验

        对序列的平稳性有两种检验方法:(1)图检验法(时序图、自相关图);(2)统计检验法(单位根检验)。此处先介绍图检验法,单位根检验在后面的章节介绍。

2.2.1 时序图检验

        时序图,以横轴表示时间,纵轴表示序列值,所形成的二维平面坐标图。基本原理平稳序列的时序图应该呈现出观测值在一个 常数值附近大致 等幅 波动的特点, 由此可知, 如果一个序列的时序图呈现出明显的(递增或递减)趋势性, 那么就应该判断序列是不平稳的。
        观察几个实例:
         显然,具有明显递增趋势,均值和时间有关系,所以不是平稳序列。
       显然,最高温度在37℃上下大致相同的幅度范围内波动,所以是平稳序列。

2.2.2 自相关图检验

        自相关图,以延迟时期数为横轴,自相关系数为纵轴,悬垂线表示自相关系数的大小,是一个二维平面坐标悬垂线图。基本原理:根据平稳序列通常具有短期相关性的特点,则随着延迟期数k的增加,平稳序列的自相关系数会很快地衰减为零,而非平稳序列的自相关系数较慢地衰减为零。(怎么定义很快地衰减呢?通常认为,上一 延迟长度样本自相关函数超过2倍标准误很多,下一个时刻直接落入2倍标准误之内

         对于非平稳时间序列,有一下两种很典型的情况:

(1)自相关图有三角对称性:序列非平稳,且具有明显单调性;

(2)自相关图有正弦或余弦状:序列非平稳,且具有周期性。

2.3 纯随机性检验

        进行纯随机性检验的原因只有那些序列值间有密切相关关系,历史数据对未来的发展有一定影响的序列(即非纯随机序列),才值得去挖掘历史数据中的有效信息,用来预测序列未来的发展。

2.3.1 纯随机序列的定义

描述性定义序列值间没有任何相关性,过去的行为对将来的发展没有丝毫影响,这种序列称为纯随机序列,也称白噪声序列。

数学定义:如果时间序列eq?%5C%7B%7BX_%7Bt%7D%7D%5C%7D满足如下性质:

                (1)任取t\in T,有E(X_{t})=u

                (2)任取t,s\in T,有\gamma(t,s)=\begin{cases}\sigma^2,t=s\\0,t\neq s\end{cases}

称序列eq?%5C%7B%7BX_%7Bt%7D%7D%5C%7D为纯随机序列,也称白噪声序列。

特点1. 白噪声序列一定是平稳序列,而且是最简单的平稳序列。

           2. 纯随机序列是一种没有分析价值的序列( 统计不相关 )
 
           3. 白噪声序列在进行时间序列分析时的作用非常大,它是时间序列分析经典模型的基本构                   件,自回归和移动平均过程都要求 随机干扰序列 零均值白噪声序列。

2.3.2 纯随机序列的性质

一、纯随机性

        指白噪声序列各值之间没有任何相关关系,即为 “没有记忆”的序列。序列完全无序的随机波动,这时,自协方差和自相关系数为0,即

\gamma(\mathbf{k})=0,\quad\forall\mathbf{k}\neq\mathbf{0}\\\rho_k=0,\forall k\neq0

二、方差齐性

        指白噪声序列中每个变量的方差都相等。

{DX_t}=\gamma(0)=\sigma^2

2.3.3 纯随机性检验

一、提出假设

二、检验统计量

1. Q统计量(Box 和 Pierce)

{Q=n\sum_{k=1}^{m}\hat{\rho}_{k}^{2}\sim\chi^{2}(m)}

其中,n为观测期数,m为指定延迟期数.(注:适合大样本

2. LB统计量(Box 和 Ljung)

\mathrm{LB=n(n+2)\sum_{k=1}^m(\frac{\hat{\rho}_k^2}{n-k})\sim\chi^2(m)}

其中,n为观测期数,m为指定延迟期数.(注:适合小样本且较为准确,更常用)

三、判别原则
        当检验统计量 > {\chi}_{1-\alpha}^{2}(m)分位点,或者该统计量的 P值 >  \alpha 时,则认为在 1-\alpha 的置信水平下可以拒绝原假设,认为该序列为非纯随机序列(即有相关性)。

Q:理论上讲对1000个观察时期,检验的延迟长度应该是m=1000-1=999,为何可以只通过短期延迟m=6和m=12的无自相关性检验,就能判定为白噪声序列?

A:(1)一方面,平稳序列一般具有短期相关性。即若序列有显著相关性,通常只存在延迟时间较短的序列值间;(2)另一方面,一个平稳序列存在短期相关性,则该序列一定不是白噪声序列,没必要进行长期延迟检验。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值