ARIMA模型实例讲解：时间序列预测需要多少历史数据？

最新推荐文章于 2024-08-15 15:27:26 发布

weixin_34405354

最新推荐文章于 2024-08-15 15:27:26 发布

阅读量7.7k

点赞数

文章标签： python matlab 数据库

原文链接：https://yq.aliyun.com/articles/177967

版权

本文探讨了ARIMA模型在时间序列预测中需要的历史数据量，通过Python进行敏感性分析，发现历史数据增多能提高预测准确性，但收益递减，提示在资源有限时可选择合适的历史数据量进行预测。

摘要由CSDN通过智能技术生成

时间序列预测，究竟需要多少历史数据？

显然，这个问题并没有一个固定的答案，而是会根据特定的问题而改变。

在本教程中，我们将基于 Python 语言，对模型输入大小不同的历史数据，对时间序列预测问题展开讨论，探究历史数据对 ARIMA 预测模型的性能影响。（雷锋网(公众号：雷锋网)注：ARIMA 全程是 Autoregressive Integrated Moving Average Model，即自回归积分滑动平均模型）

具体来说，在本教程中，我们将：

● 加载标准数据集并输入 ARIMA 模型；

● 对历史数据年份进行敏感性分析；

● 分析敏感性分析的结果。

通过本例提供的模板，大家将可以根据各自特定的时间序列预测场景，展开类似的针对历史数据大小的敏感性分析。

加载数据集

本例中我们使用来自澳大利亚气象局的一份数据，该数据描述了墨尔本市 10 年（1981 - 1990年）内的每日最低气温，单位为摄氏度，观测值共 3650 次。

这里我们将下载好的数据集保存在 daily-minimum-temperature.csv 文件中。

这里需要注意的是，下载文件中有一些多余的“?”字符，可以通过文本编辑器打开并删除，否则模型无法处理。此外，文件中的脚注信息也需要删除。

以下代码展示了如何加载数据库，并生成 Pandas 库中的 Series 对象。

# line plot of time series
from pandas import Series
from matplotlib import pyplot
# load dataset
series = Series.from_csv('daily-minimum-temperatures.csv', header=0)
# display