arima模型 p q d 确定_匹兹堡Mingda Zhang时间序列AR, MA, ARMA, ARIMA讲座重点回忆(超赞!)...

Time Series: Autoregressive models AR, MA, ARMA, ARIMA

Mingda Zhang University of Pittsburgh mzhang@cs.pitt.edu

时域vs频域

504d234ed43a2c375df45701821c31c3.png

This lecture will focus on univariate, linear, discrete time series.

fb5477a2d04dc4cd37f3dcc6b7eb4548.png

20c7df57a718e95d88341d789ae667f3.png

白噪声

2a305292b888b684d47dda75a6761d10.png

高斯白噪声

e6172c66622c86098350908d23655291.png

白噪声时间序列是一个非常有趣的问题,因为如果所有时间序列的随机行为都能用白噪声模型来解释,那么经典的统计方法就足够了。

随机游走

随机漫步是指随机移动的物体离开它们开始的地方的过程。

d9b508fe2e76bba07719a4c0522bd3d2.png

时间序列分析

利用已知数据值拟合具有合适模型的时间序列并估计相应参数的过程。它包括试图了解时间序列性质的方法,通常对未来的预测和模拟有用。

有几种方法可以建立时间序列预测模型,但这节课的重点是随机过程。

558f629043043fc85f66da153d38cd43.png

。。。(有些废话)

e1d29cee490eed791bd76479303d864c.png

自协方差函数

dff02b4bbe8024fde571494a0809c2a1.png

自协方差测量的是两个点在不同时间观测到的同一序列上的线性关系。

非常平滑的序列:即使t和s相距很远,自协方差函数也会保持较大,而起伏的序列:当距离较大时,自协方差函数几乎为零。

自相关函数Autocorrelation Function (ACF)

1d56c74f4c592cb78eaa12059f035881.png

预测是困难的,因为时间序列本质上是不确定的,也就是说我们不能肯定地预测未来会发生什么。但如果时间序列是平稳的,问题可能会简单一些:你只需预测它的统计特性在未来将与过去相同。

平稳时间序列是指其统计特性,如均值、方差、自相关等都随时间保持不变。

大多数统计预测方法都是基于时间序列经过数学变换后近似平稳的假设。

严平稳

821b65097c38fe916f04dfb188c30eee.png

宽/弱平稳

77e7db01848b3d7280b4155d448c7918.png
通常平稳一词指的是宽平稳,当人们想强调一个过程严格意义上的平稳时,他们会使用严平稳。
严格的平稳性并不假设有限的方差,因此严格的平稳并不一定意味着弱平稳。如iid柯西过程严平稳,但不是弱平稳。 严平稳时间序列的非线性函数仍然是严平稳的,但对于弱平稳则不成立。弱平稳性通常并不意味着严格的平稳性,因为过程的高阶矩可能依赖于时间t。

b754ffb9998cca31ef43af503afc28a9.png

平稳时间序列的自相关

70087203fbb3d9f7c408029016d64236.png

偏自相关Partial Autocorrelation Function (PACF)

另一个重要的度量是偏自相关,即去掉中间所有东西的线性效应后,Xs和Xt之间的相关。

aeb68a449e197574873158ae536a36c8.png

ARIMA Models

ARIMA是一个缩写词,代表差分自回归移动平均模型。
AR自回归。利用一个观测值和一些滞后观测值之间的依赖关系的模型。
I整合。利用原始观测值的差分使时间序列保持平稳。
MA移动平均线。一种模型,利用观测值与应用于滞后观测的移动平均模型的残差之间的相关性。
这些组件中的每一个都在模型中作为参数显式指定。注意,AR和MA是两种广泛使用的线性模型,它们都适用于平稳时间序列,而I是一个预处理程序,用于在需要时使时间序列平稳。

使用ARIMA(p, d, q)的标准表示法,将参数替换为整数值,以快速指示所使用的特定ARIMA模型:
p模型中包含的滞后观测次数,也称为滞后阶数。
d原始观测值被差分的次数,也称为差分程度。
q移动平均窗口的大小,也叫移动平均阶。

可以将值0用于参数,该参数指示不使用该子模型。换句话说,ARIMA模型可以配置为执行ARMA模型的功能,甚至是简单的AR、I或MA模型。

Autoregressive Models:AR(p)

70dfd3df8a862597ea318d48620f1d24.png

065543e1bc2794eff8f6f0100dc41ddf.png

dab95586cd853e2801a00dcff051ceaf.png

AR Example: AR(0) and AR(1)

be6817c95fe1b4ddb11943a096ef4115.png

0b38f3d6555e5ecda81d03e878d6b4a9.png

adfa9e9125668a3d53941ed57a9f6f14.png

b7d5a652e9795101d3d3f08d7f7258e4.png

53f8b232c3f4e5d8539a57ebb3300059.png

897f1434d9e65f5448f0baf0466ef007.png

7a67c33b8955ef233be460b15325342b.png

4199488aa09d7d38b99dcc47110b7bd4.png
稳态解

AR Problem: Explosive AR Process

715bf52779ab02d783231c87179c2fcf.png

我们用因果关系的概念来描述时间序列,它不仅是平稳的,而且不依赖于未来。

General AR(p) Process

feff66bd0739f3177b287fec100150b0.png

事实上,识别AR模型通常最好使用PACF。

AR Models: Parameters Estimation参数估计

注意,p类似于AR(p)过程的超参数,因此拟合AR(p)模型假设p已知,并且只关注估计系数Φ1,...Φp

这有许多可行方法:矩估计法(如Yule-Walker估计法)、最大似然估计法(MLE)、普通最小二乘估计法(OLS)

如果观测到的序列很短或过程很不平稳,那么各种方法的参数估计将有很大的差异。

Moving Average Models (MA)

这个名字可能会误导人,但移动平均模型不应该与移动平均平滑相混淆。

Motivation:AR模型的一个问题是在时间序列中忽略了相关的噪声结构(这是不可观测的)。

Definition:

47576f47591d8778ba59a060dcb01a00.png

虽然它看起来像一个回归模型,但不同之处在于wt是不可观测的。

与AR模型相反,有限MA模型总是平稳的,因为观测值只是过去预测误差的加权移动平均。

Moving Average Operator

3ae26d4539b514cf99e68abb4585b23f.png

761a3e007af416b7c608efb312c25ed6.png

d3d2347413165cf708e948003ad74750.png

2387d4370defa2e7685f6d2791756d1a.png

2b85cfce2e6a677b7a7f2ee41a274250.png

3fb2d584be69f881aa7c9b6cdab66053.png

一般而言MA(q)模型的一个重要属性:对the first q lags有非零自相关;对所有h > q,ρh = 0.换句话说,ACF提供了大量关于MA(q)过程依赖q阶数的信息。

MA模型的识别通常最好使用ACF而不是PACF。

MA Problem: Non-unique MA Process

839f7237c42c05f1727b605c0327c959.png

传统上,我们定义了可逆性的概念,并且总是从多个选项中选择可逆性表示。

668a2ac6585ea27da8d9ec77561f48b8.png

5f00ccd64bfa6dc5c0d654924c18b7ee.png

事实上,所有的因果AR(p)过程都可以表示为MA(∞);换句话说,无限移动平均过程是有限的自回归过程。所有可逆MA(q)过程都可以表示为AR(∞)。即有限移动平均过程是无限自回归过程。

MA Models: Parameters Estimation参数估计

MA模型的参数估计比AR模型更难。一个原因是滞后误差项是不可观测的。

我们仍然可以用矩量估计法对MA过程进行估计,但不能得到具有约尔-沃克方程的最优估计。

事实上,由于MA过程的参数是非线性的,我们需要迭代非线性拟合而不是线性最小二乘。从实用的角度来看,现代科学计算软件包在给出正确配置之后将处理大部分细节。

ARMA Models

自回归模型和移动平均模型可以结合起来形成ARMA模型。

3bef1148fb16523ec1cf2b5d06469cf1.png

ARMA Problems: Redundant冗长 Parameters

0145bf6d85d3c27e2b269e696c1709b7.png

如果我们没意识到参数冗余,我们可能会声称数据是相关的,而实际上它们不是。

Choosing Model Specification

我们讨论过ACF和PACF可用于ARIMA模型超参数p和q的测定。

53dfbc3e2b906bf77886cadb171e78bc.png

选择q和q也可以使用其他标准,如AIC (Akaike信息准则)、AICc(更正AIC)和BIC(贝叶斯信息准则)。注意,p和q的选择并不惟一。

“Stationarize” Nonstationary Time Series

ARMA模型的一个限制是平稳性条件。在许多情况下,时间序列可以被认为是由两个组成部分,一个非平稳趋势序列和一个零均值平稳序列

80862c5f452f5e657e763e4888df0e9e.png

1f8f7550b4bc0f7a7cfb182240fcb2c9.png

在趋势消除方面,差分法优于去趋势法的一个优点是不需要参数估计。
事实上,差分运算是可以重复的。第一个差分消除了线性趋势。第二个差分可以消除二次趋势。

c4247db75ea1c58b712c86f3bd266d69.png

Detrending vs. Differencing

080919a68c7b770e8b1f2267ac77ada5.png

From ARMA to ARIMA

2f3c6493a5a6265542f1b361b2633698.png

Box-Jenkins Methods

我们已经看到ARIMA模型有许多参数和超参数,Box和Jenkins提出了一种迭代的三阶段方法来估计ARIMA模型。

Procedures

1模型识别:检查平稳性和季节性,必要时进行差分,选择模型规格ARIMA(p, d, q)。

2参数估计:使用最大似然估计或非线性最小二乘估计计算最适合所选ARIMA模型的系数。

3模型检验:检验得到的模型是否符合平稳单变量过程的规范(即残差相互独立,均值和方差恒定)。如果失败,回到步骤1。

实例

Air Passenger Data

e6db20907624ff55d41e8ed7a2c09e37.png

Model Identification

与任何数据分析一样,我们应该构造数据的时间图,并检查图中是否有异常。这个阶段最重要的事情是确定时间序列是否平稳,以及是否有任何需要处理的重要季节性。、

Test Stationarity

回想一下定义,如果均值或方差随时间变化,那么它是非平稳的,因此一种直观方法是绘制滚动统计数据。我们也可以做一个自相关图,因为非平稳时间序列通常显示非常缓慢的衰减。
一种完善的统计测试——增广的迪基-富勒测试(augmented Dickey-Fuller test)——可能会有所帮助。零假设是时间序列非平稳。

f6ed90ac9e2cf8602447d53b00ad68c4.png

0dfb56938ebec834b9e0d5d821443367.png

63e2110c6a41e3faca69f8595b32d2bb.png

测试统计量是一个负数。负的越多,零假设的拒绝就越强。

Stationarize Time Series

由于以往的方法都表明初始时间序列是非平稳的,因此在ARMA建模中需要对初始时间序列进行变换使其平稳。

e1ad0f9621f9f00a817d48f7209f9e39.png

91e6aaefbacd3aaca32f8ff6681634f0.png

dc0800a72d79a7b3417e210f93cb65ea.png

从ACF图中我们可以看出,平均值和std随时间的变化要小得多。同时,ADF检验统计量小于10%的临界值(???),说明时间序列是平稳的,有90%的置信度。(???)

Choosing Model Specification

96e871bd1b415551f36d0af84c71fc3f.png

df1bd7c55ea1b8984ad21028e86725f0.png

RSS是对数据和估计模型之间的差异的度量。RSS小表示模型与数据紧密匹配。

1970c4bf038e8fc858b47aaddd4b3b2d.png

d980a8d47526f6473050eb98abaf5d1d.png

在这里,我们可以看到AR(2)和MA(2)模型具有几乎相同的RSS,但是组合起来要好得多。

Forecasting

最后一步是反转我们已经完成的转换,以得到原始规模上的预测。

9a642c41632a3b193f21db223ad4f5e5.png

SARIMA: Seasonal ARIMA Models

在以前的模型中,一个问题是缺乏季节性,这可以在ARIMA模型的一个广义版本(季节性ARIMA)中得到解决。

fe340ef2f7821b782e30a732e112ce03.png

模型的季节部分由与非季节成分相似的项组成,但涉及季节周期的后移。

d6bd05711477be057e7f77beabf80c17.png
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值