偏自相关分析
○作用:偏自相关分析主要用于确定数据序列p、q进行定阶
○输入:一列时间序列数据;设置差分阶数(可先进行ADF检验后再输入)
○输出:ACF与PACF图,方便用户确定p、q值
自相关(ACF)是指序列与其自身经过某些阶数滞后形成的序列之间存在某种程度的相关性,而偏自相关函数(PACF)是在其他序列给定情况下的两序列条件相关性的度量函数。一般来说(偏)自相关用于时间序列分析ARIMA的q、p进行定阶,但该方式定阶不一定准确。
从步骤上讲,偏自相关分析共分为四个步骤:
○ Step1: 自相关(ACF)图拖尾,偏自相关(PACF)图在p阶进行截尾,ARMA模型可简化为AR(p)模型
○ Step2:自相关(ACF)图在q阶进行截尾,偏自相关(PACF)图拖尾,ARMA模型可简化为MA(q)模型
○ Step3: 倘若自相关与偏自相关图均拖尾,可结合PACF、ACF图中最显著的阶数(最小值)作为p、q值
○ Step4: 倘若自相关与偏自相关图均截尾,可以选择更换更高的差分,或说明不适合建立ARMA模型
偏自相关分析的案例
1
数据
现有某奶茶店刚开业6周每天的销售额(单位:元)的数据,希望通过自相关图和偏自相关图去判断ARMA模型的阶数,部分数据如下所示:
2
理论
偏自相关函数是排除了其他中间变量的影响,真实反映了两个变量之间的相关性。一般来说(偏)自相关分析用于时间序列分析ARIMA的q(移动平均项数)、p(自回归项数)进行定阶。时间序列要求数据是平稳的,平稳过程的自相关系数和偏自相关系数都会以某种方式衰减趋于0。若某一时间序列的自相关函数随着滞后k阶的增加而很快下降为0,可以认为该序列为平稳序列,得到平稳序列对应的q值、p值进行定阶。
若自相关函数不随着k的增加而迅速下降为0,就表明该序列不平稳,可以对此非平稳序列进行差分,然后再对每次差分的序列考查它的自相关函数,直到平稳为止。
偏自相关分析涉及到的相关概念如下:
○ 截尾是在置信区间内,ACF或PACF在大于某阶后快速趋于0,即k阶截尾(某阶后直接变为0或在0附近随机波动)
○ 拖尾是在置信区间内,ACF或PACF始终有非零取值,不呈现大于某阶后就恒等于零(或在0附近随机波动)
○ 判断时间序列模型的p、q值时要结合ACF图和PACF图进行判断。若均出现拖尾,可以认为此差分适合构造ARIMA模型,可选择ACF图中最显著的阶数作为q值,选择PACF中最显著的阶数作为p值;若均出现截尾,说明数据为白噪声,那么不适合构造ARIMA模型
3
操作
本次分析只需将字段直接拖拽到右侧的框即可,操作如下图:
设置差分阶数,默认不差分,一般情况下建议先进行ADF检验确定差分阶数后再进行本次分析:
4
MPai输出结果
MPai的输出结果共有2张图,如下:
○ 自相关图(ACF),判断数据截尾或拖尾情况
○ 偏自相关图(PACF),判断数据截尾或拖尾情况
5
具体分析
上图展示了自相关图(ACF),包括系数、置信上限和置信下限,分析数据的截尾情况。在本案例中,从ACF图可知,无论如何,最终都没有趋近于0,因此为拖尾现象。从图大致判断得知,取ACF图中最显著的阶数作为q值,即选取q=3。接着还需要分析偏自相关图PACF,如下所示:
上图展示了偏自相关图(PACF),包括系数、置信上限和置信下限,分析数据的截尾情况。在本案例中,从PACF图可知,无论如何,最终都没有趋近于0,因此为拖尾现象。从图上大致判断得知,取PACF图中最显著的阶数作为p值,即选取p=4。
结合PACF图与ACF图,MPai建议移动平均阶数q值为3,自回归阶数p值为4。因此使用ARMA(4,3)模型。通过分析图所选取的p和q值是由用户主观判断的,用户在选取p值和q值上并不唯一,没有绝对的标准,需用户按照模型的要求来选取才能得到最优模型。
6
划重点
偏自相关分析中涉及的理论和注意事项,如下:
○ 一般来说(偏)自相关用于时间序列分析ARMA的q、p进行定阶,判断时需结合ACF图和PACF图共同判断
○ 根据图所选取的p和q值是由用户主观判断的,用户在选取p值和q值上并不唯一,没有绝对的标准,建议结合AIC值比较,选取最优模型
7
参考文献
[1] 广州万灵数据科技有限公司.自动数据处理与多协议接入的数据分析平台.http://www.mpaidata.com. 2020-04-22-。
MPai数据科学平台
官网:https://www.mpaidata.com