1.AR(Autoregressive)模型
自回归模型描述的是当前值与历史值之间的关系。参数代表了波动系数,跟前一时间的变化。
2.MA(Moving average)模型
滑动平均模型描述的是自回归部分的误差累计(波动误差的关系)
3.ARMA模型
AR与MA 的结合:ARMA(p,q),p和q分别为AR和MA的阶数
4.平稳性
ARMA的模型要求时间序列是平稳的。
一个时间序列,如果均值没有系统的变化(无趋势)、方差没有系统变化,且严格消除了周期性变化,就称为平稳的。(可以有变化,但必须是无规律的小变化)
5.差分
时间序列t时刻的值和t-1时刻的值差d构造的新序列为一阶差分。再对其进行相同的差分运算,可以得到二阶差分。
通常非平稳的序列可以经过d阶差分得到弱平稳或近似弱平稳的时间序列。
ARIMA(p,d,q)模型:p为自回归滞后项,q阶滑动平均滞后项,d阶差分。
6.相关系数
反应两个空间中两个向量之间相关关系密切程度的统计指标。
7.自相关函数(ACF)
某随机信号再不同时刻的取值之间的相关程度。
8.偏自相关函数(PACF)
阶次为s的偏自相关:去除信号中所有滞后期小于s的信号影响后,当前信号与滞后s阶的信号之间的关系。
9.ARIMA模型参数选择
9.1.检查序列是否平稳
若不平稳,使用差分平稳化序列,确定差分阶数d
9.2.ARMA定阶
通过PACF确定AR的阶数p
通过ACF确定MA的阶数q
9.3 根据参数p,d,q建立模型ARIMA(p,d,q)
10.案例:股票数据分析
10.1 步骤
准备数据、可视化数据审查数据、处理数据、根据ACFPACF定阶、拟合ARIMA模型、预测
10.2 代码及注释
# -*- coding: utf-8 -*-
import pandas as pd
import pandas_datareader
import datetime
import matplotlib.pylab as plt
from matplotlib.pylab import style
from statsmodels.tsa.arima_model import ARIMA
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf
style.use('ggplot') # 设置图片显示的主题样式
# 解决matplotlib显示中文问题
plt.rcParams['font.sans-serif'] = ['SimHei'] # 指定默认字体
plt.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题
def run_main():
"""
主函数
"""
# 1. 准备数据
# 指定股票分析开始日期
start_date = datetime.datetime(2007, 1, 1)
# 指定股票分析截止日期
end_date = datetime.datetime(2017, 3, 1)
# 股票代码
stock_code = '600519.SS' # 沪市贵州茅台
stock_df = pandas_datareader.data.DataReader(
stock_code, 'yahoo', start_date, end_date
)
# 预览数据
print(stock_df.head())
# 2. 可视化数据
plt.plot(stock_df['Close'])
plt.title('股票每日收盘价')
plt.show()
# 按周重采样
stock_s = stock_df['Close'].resample('W-MON').mean()
stock_train = stock_s['2014':'2016']
plt.plot(stock_train)
plt.title('股票周收盘价均值')
plt.show()
# 分析 ACF
acf = plot_acf(stock_train, lags=20)
plt.title("股票指数的 ACF")
acf.show()
# 分析 PACF
pacf = plot_pacf(stock_train, lags=20)
plt.title("股票指数的 PACF")
pacf.show()
# 3. 处理数据,平稳化数据
# 这里只是简单第做了一节差分,还有其他平稳化时间序列的方法
# 可以查询资料后改进这里的平稳化效果
stock_diff = stock_train.diff()
diff = stock_diff.dropna()
print(diff.head())
print(diff.dtypes)
plt.figure()
plt.plot(diff)
plt.title('一阶差分')
plt.show()
acf_diff = plot_acf(diff, lags=20)
plt.title("一阶差分的 ACF")
acf_diff.show()
pacf_diff = plot_pacf(diff, lags=20)
plt.title("一阶差分的 PACF")
pacf_diff.show()
# 4. 根据ACF和PACF定阶并建立模型
model = ARIMA(stock_train, order=(1, 1, 1), freq='W-MON')
# 拟合模型
arima_result = model.fit()
print(arima_result.summary())
# 5. 预测
pred_vals = arima_result.predict('20170102', '20170301',
dynamic=True, typ='levels')
print(pred_vals)
# 6. 可视化预测结果
stock_forcast = pd.concat([stock_s, pred_vals], axis=1, keys=['original', 'predicted'])
plt.figure()
plt.plot(stock_forcast)
plt.title('真实值vs预测值')
plt.savefig('./stock_pred.png', format='png')
plt.show()
if __name__ == '__main__':
run_main()