天池比赛-资金流入流出预测-挑战Baseline--时间序列初探

本文通过参加天池比赛,探索预测余额宝申购和赎回总量的方法。使用时间序列分析,重点介绍了ARMA模型的实现,包括数据预处理、平稳性与白噪声检验、序列差分以及模型定阶。通过单位根检验和ACF/PACF图确定模型参数,但初步模型的预测误差较大,提示需要进一步优化。
摘要由CSDN通过智能技术生成

比赛地址在此:点击打开链接

起因:它这个项目是预测未来30天余额宝的总的申购总量和赎回总量,这个是跟余额宝的利率和上海银行间借拆利率有关。然而它30天后的这两个数值并没有给出,因此需要用时间序列来预测。

需要的工具库:

1.numpy  

2.pandas

3.statsmodels

4.matplotlib

第一步:读取数据
# 读取数据,并让report_date字段值成为index
date_interest=pd.read_csv(r'../analyed_data/date_interest.csv',index_col='report_date',parse_dates=['report_date'])
columns=date_interest.columns
# 因为有10个属性,所以需要每一个分开来进行预测
for i in range(len(columns)):
   print(date_interest.iloc[:,i].describe())
第二步:对数据进行统计分析

 主要步骤有:

 1.摘要分析

  2.画出时序图

 具体实现:

 1.首先实现绘制时序图的函数

def draw_trend(timeSeries,column): 
     f=plt.figure(facecolor='white')
     timeSeries=timeSeries.diff(3)
     timeSeries.plot(color='blue',label='timeSeries')
     plt.legend(loc='best')
     plt.title(column)
     plt.show()

 
 2.绘制时序图
date_interest=pd.read_csv(r'../analyed_data/date_interest.csv',index_col='report_date',parse_dates=['report_date'])
    columns=date_interest.columns
    for i in range(len(columns)):
        data=date_interest.iloc[:,i]
        column=columns[i]    
        # 绘制时序图
        draw_trend(data,column)

评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值