如果数据分析师的模型能准确预测明日的大盘指数,就太好了。想想不禁窃喜,再一秒,告诉自己这是不可能滴。不过正是这也有趣的想法和实在的应用场景,让实践变得越来越趣味横生,鼓动自己对某些知识的学习。
进入正题,本文使用公开数据源:近10年(2007-08-29至2017-08-25)每个交易日的NASDAQ指数。与大家分享,使用python语言,建立ARIMA模型,完成NASDAQ指数预测的全过程。
使用pandas的read_excel方法读取存储在Excel中的数据。代码如下所示:
mydata = pd.read_excel('纳斯达克指数.xlsx',sheetname='Sheet1')
1. 获取时间序列数据
原始数据是长得这样的,Date列表示日期,数据类型为日期类型。Close/Last为当日休市时指数值。
先使用pandas读入dataframe,然后使用Series将数据转化为时间序列对象,index为时间序列值对应的时刻。
时间序列走势图如下所示,非平稳。
点击上图中的Figure options可以通过可视化界面来给所制作的图形加上图表标题、横坐标标题、纵坐标标题。还可以人工调整x,y轴最大值最小值。这个与之前我们的一篇EXcel调整横坐标、纵坐标轴的操作相类似。