自相关和偏自相关图在时间序列分析和预测中经常使用。
这些图生动的总结了一个时间序列的观察值与他之前的时间步的观察值之间的关系强度。初学者要理解时间序列预测中自相关和偏自相关之间的差别很困难。
在本教程中,您将发现如何使用Python来计算和绘制自相关图和偏自相关图。
完成本教程后,您将知道:
如何绘制和检查时间序列的自相关函数。
如何绘制和检查时间序列的偏自相关函数。
时间序列分析中自相关函数和偏自相关函数之间的差异。
让我们开始吧。
每日最低气温数据集
该数据集描述了澳大利亚墨尔本市10年(1981 – 1990年)的最低每日气温。
单位为摄氏度,观测值为3650次。数据来源于澳大利亚气象局。
点击这里了解更多信息并从Dara Market下载数据集。
下载数据集并将其放在您当前的工作目录中,文件名为“ daily-minimum-thermometer.csv ”。
注意:下载的文件包含一些问号(“?”)字符,必须先删除它然后才能使用数据集。在文本编辑器中打开文件,并删除“?”字符。同时删除文件中的任何页脚信息。
下面的示例将加载最低每日温度并绘制时间序列。
from pandas import Series
from matplotlib import pyplot
series = Series.from_csv('daily-minimum-temperatures.csv', header=0)
series.plot()
pyplot.show()
运行该示例将数据集加载为Pandas序列,并创建时间序列的折线图。