01
基础知识
ARIMA(Autoregressive Integrated Moving Average,自回归集成移动均值)模型被称为是计量经济学家的良心,这即是说,如果一个人建立的时间序列模型不能有比它更好的预测能力,那就相当于他没有良心。Python是当下最为流行的开源数据科学编程语言,虽然在计量领域的应用不如R广泛,但仍然可以完成很多基础计量模型的建立。第一步是要安装Python,建立直接下载Anaconda,里面集成了多个数据科学软件包。本次我们用Python建立ARIMA模型来预测股价数据。
ARIMA(p,d,q)模型的基础形式如下:
括号中的d表示差分d次,对于一个长度为N的序列,差分d次后得到一个长度为N-d的序列。可以看出ARIMA模型的思想是很简单的:序列下一期的值就是等于前d期的加权平均加上前几期残差的加权平均。
事实上假如我们取p为1,d为0(不进行差分),q为0,则可以看出这实际上可以视为一个带漂移项的随机游走。在实际的经济序列中,大多数都是单位根非平稳,需要差分一次变成平稳序列。
02
Python的实现
本文用到的jupyter notebook文件可从网盘获得,文件夹对应本文编号0001:
https://pan.baidu.com/s/1jHR