自回归移动平均模型(ARIMA)是一种常用于时间序列分析和预测的线性模型。
statsmodels库提供了Python中使用ARIMA的实现。ARIMA模型可以保存到文件中,以便以后对新数据进行预测。在当前版本的statsmodels库中有一个bug,它阻止了保存的模型被加载。
在本教程中,你将了解如何诊断并解决此问题。
让我们开始吧。
每日女婴出生数据集
首先,让我们看看标准时间序列数据集,我们可以用statsmodels ARIMA实现来理解这个问题
这个每日的女婴出生数据集描述了1959年加利福尼亚每日出生的女婴数量。
它的单位是数值型,有365个观察值。数据集的来源于Newton (1988)。
你可以从DataMarket网站了解更多信息并下载数据集。
下载数据集并将其放在你当前的工作目录中,文件名为 “ daily-total-female-births.csv ”。
以下的代码将加载并绘制数据集。
from pandas import Series
from matplotlib import pyplot
series = Series.from_csv('daily-total-female-births.csv', header=0)
series.plot()
pyplot.show()
运行该示例加载数据库,并生成 Pandas 库中的 Se