时间序列预测(数据使用passengers.csv,算法用ARIMA)

查看数据结构:

import pandas as pd
data = pd.read_csv('/Users/liailan/tmp/AirPassengers.csv')
print(data.head())
   Unnamed: 0     time  value
0           1  1949-01    112
1           2  1949-02    118
2           3  1949-03    132
3           4  1949-04    129
4           5  1949-05    121

输出:

   Unnamed: 0     time  value
0           1  1949-01    112
1           2  1949-02    118
2           3  1949-03    132
3           4  1949-04    129
4           5  1949-05    121

载入数据:

dateparse = lambda x:pd.datetime.strptime(x,'%Y-%m')
data = pd.read_csv('/Users/liailan/tmp/AirPassengers.csv',parse_dates=['time'],date_parser=dateparse)
data = data.set_index('time')

 确定序列是否稳定:

   直观观察:

import matplotlib.pylab as plt
%matplotlib inline
plt.plot(data.value)

可以看到,这个序列具有明显的趋势性和季节性,那么首先需要将序列转化为稳定序列,常用的有差分方法,这里采用另外一种,将数据分解为趋势序列,季节序列和残差序列

 
import numpy as np
ts_log = np.log(data['value'])
from statsmodels.tsa.seasonal import seasonal_decompose
decomposition = seasonal_decompose(ts_log,freq=12)
trend = decomposition.trend #趋势
seasonal = decomposition.seasonal  #季节性
residual = decomposition.resid     #残差序列
residual.dropna(inplace=True)

判断残差序列的稳定性:


                
  • 5
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 6
    评论
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值