数据分析-ARIMA方法建模步骤总结

ARIMA模型适用于非平稳时间序列数据,其中的I表示差分的次数,适当的差分可使原序列成为平稳序列后,再进行ARIMA模型的建模。

其建模步骤与ARMA模型类似,分为5个步骤:

  1. 平稳: 通过差分的手段,对非平稳时间序列数据进行平稳操作。
  2. 定阶: 确定ARIMA模型的阶数p, q。
  3. 估计: 估计未知参数。
  4. 检验: 检验残差是否是白噪声过程。
  5. 预测: 利用模型预测。

对应的,在商业领域,时间序列预测应遵循如下建模流程。

Created with Raphaël 2.2.0 步骤1: 绘制时间序列图形 步骤2: 是否有季节性 步骤2.1: 使用ARIMA函数,遍历p, d, q 的取值,根据AIC最低者选取最优模型 步骤3: 使用最优模型的参数进行模型估计 步骤4: 检验模型参差的ACF和PACF函数,查看是否还有信息?如果没有相关性,则表明模型设置正确。 步骤5: 使用模型预测 步骤2.2: 如果季节效应的振幅有扩大的趋势,则原始数据取对象,否则不变 步骤2.2.2: 使用SARMIAX函数,遍历p, d, q和季节的p, d, q取值,根据AIC最低者选取最优模型。 yes no

步骤1: 这是必需的,如果不看时间序列的图形,就不能确定是否有季节性。可能有人认为,既然SARIMAX函数的功能可以涵盖ARIMA函数,那就可以统一使用SARIMAX函数遍历所有参数得到最优模型。但是这样做是不可取的,因为SARIMAX函数的参数过多,模型的估计结果不稳定,因此如果数据没有季节行,应尽量选择ARIMA函数进行估计。

步骤2: 参数选取范围在(0,1,2)中即可,很少有参数超过2的情况,即使真的超过2,第3阶的信息也很少,可以忽略。实在有问题,还可以在步骤4中通过观看参差的情况判断是否扩大搜索空间。选取最优模型的依据为AIC或BIC统计量。AIC统计量选取的模型较大,即模型参数较多;BIC统计量选取的模型较小,即模型参数较少。不过绝大部分情况下两个统计量得到的模型是一样的。

步骤3: 使用上一步得到的最优模型进行重新模型估计。模型估计好,可以查看模型的参数。本步骤并没有进行时间序列的平稳性校验,这有两个考虑: 一是平稳性检验的方法众多,statsmodels中提供的adfulle函数其实是聊胜于无,用户不大;二是目前统计学界提供的平稳型检验方法的势(power)都不高,也就是说检验结果不那么有用处。实际上相关系数为0.9以上的AR(1)和ARIMA(0, 1, 0)是不能通过平稳型校验区分开的。因此索性不做平稳型检验,仅依靠AIC或BIC统计量来判断最优模型即可。

步骤4: 该步骤目的是确认模型正确性。如果参差序列的前几阶(比如5阶)自相关,偏自相关函数没有显著的,则说明已经是最优模型。统计学参考书中会使用DW检验(德宾-沃尔森检验),Q-Q检验,Q检验,其实和查看自相关函数区别不大。

步骤5: 本步骤中,如果之前数据取了自然对数,则在使用模型预测后,要对数据取自然指数。

  • 9
    点赞
  • 97
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
ARIMA(Autoregressive Integrated Moving Average)模型是一种常用的时间序列预测方法。下面是 ARIMA 模型建模步骤: 1. 导入时间序列数据:首先,将要预测的时间序列数据导入到 Matlab 中,并将其存储在一个向量中。 2. 数据预处理:对时间序列数据进行预处理,以满足 ARIMA 模型的假设条件。这可能包括去除趋势、季节性调整、平稳化等操作。 3. 确定差分阶数(d):使用差分运算来平稳化时间序列数据。通过观察时间序列的自相关图(ACF)和偏自相关图(PACF),确定需要进行几阶差分操作。 4. 确定 AR 和 MA 阶数(p 和 q):使用自相关图(ACF)和偏自相关图(PACF)来确定 AR 和 MA 的阶数。自相关图显示了时间序列与其滞后版本之间的关系,偏自相关图显示了时间序列与其滞后版本之间的关系,消除了其他滞后版本的影响。 5. 估计模型参数:使用确定的差分阶数(d)、AR 阶数(p)和 MA 阶数(q),通过最大似然估计或其他方法估计 ARIMA 模型的参数。 6. 模型检验:对估计的 ARIMA 模型进行残差分析,以验证模型是否符合统计假设。常见的检验方法包括检查残差序列是否为白噪声、是否具有常数方差等。 7. 模型预测:使用估计的 ARIMA 模型进行未来时间点的预测。可以使用 `forecast` 函数来生成预测结果,并可视化结果以评估预测性能。 以上是 ARIMA 模型的基本建模步骤。在实际应用中,可能需要根据数据的特点进行适当的调整和改进。此外,还可以尝试其他时间序列模型,如 SARIMA、GARCH 等,以进一步提高预测精度。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小狼躲藏

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值