ar自回归 python_时间序列分析 | 向量自回归模型

向量自回归模型的英文名称为Vector Autoregressive model,常被简写成VAR。向量自回归的出现由来已久,可以追溯到上个世纪80年代,人们构建向量自回归模型主要出于以下考虑:

  • 时间序列分析从单一时间序列 (time series data) 拓展到了多元时间序列 (multivariate time series),在任意第
    个时间间隔 (time interval),观测样本从
    变成了
    ,其中,
    表示多元时间序列中时间序列的数量。
  • 标准的自回归模型 (Autoregressive model, 简称AR) 其表达式过于简单,无法很好地在多元时间序列分析中发挥作用。

1 标准的自回归模型

在统计学、经济学乃至信号处理等领域,自回归模型被广泛应用于描述随时间变化的过程 (简称时变过程),其中,最为经典的应用当属时间序列分析,在这里,自回归模型假设变量之间存在一个线性的依赖关系,即输出变量 (output variables) 如

与输入的历史变量 (previous variables) 如
存在一个线性表达式。

不妨先看一下标准的自回归模型:给定单一时间序列

,其时间间隔的数量为
,则对于任意第
个时间间隔,存在如下的线性表达式:

其中,

表示回归系数;常数
表示自回归模型的阶数 (order),也可以将
简单地理解成当前时间点关联过去时间点的数量。

在自回归模型中,我们的目标是从观测数据中学习出参数

。现假设观测数据为
,首先,我们需要对自回归模型的线性表达式进行改写:

其中,

. 在这里,写成这种形式完全是为了简化后续的推导。

如果进一步将

作为高斯噪声,采用最小二乘法,则回归系数
的最优解为

2 多元时间序列

实际上,相比单一的时间序列数据,多元时间序列数据反而更为常见,是由单一的时间序列构成,如下面的矩阵

就是一般形式的多元时间序列数据。在矩阵

中,任意第
个时间间隔下,观测值为

观测值的数量为

.

3 向量自回归模型

针对多元时间序列数据,向量自回归模型采用了一种更为灵活的时序建模策略:给定多元时间序列数据为

,则对于任意第
个时间间隔,存在如下的线性表达式:

其中,

表示向量自回归模型的系数矩阵;
可视为高斯噪声。

为方便后续推导,与自回归模型类似,令

将向量自回归模型进行改写:

其中,公式中的矩阵

定义如下:

由此,采用最小二乘法,系数矩阵

的最优解为

在这里,我们用到了F-范数与矩阵迹 (trace) 之间的等价变换,它的意义是为了方便推导,如何简单理解这种等价变换呢?举一个例子:给定任意大小为
的矩阵

由于F-范数是矩阵所有元素的平方和开根号,即

另外,

因此,根据矩阵迹的定义,有

4 相关参考

本文来源于https://nbviewer.jupyter.org/github/mobility-computing/GrapicalML/blob/master/content/bvar.ipynb,原文主要讨论了向量自回归模型的原理,并介绍了如何用numpy实现向量自回归模型。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值