项目:股票数据分析(ARMA)

1.AR(Autoregressive)模型

自回归模型描述的是当前值与历史值之间的关系。参数代表了波动系数,跟前一时间的变化。

2.MA(Moving average)模型

滑动平均模型描述的是自回归部分的误差累计(波动误差的关系)

3.ARMA模型

AR与MA 的结合:ARMA(p,q),p和q分别为AR和MA的阶数

4.平稳性

ARMA的模型要求时间序列是平稳的。
一个时间序列,如果均值没有系统的变化(无趋势)、方差没有系统变化,且严格消除了周期性变化,就称为平稳的。(可以有变化,但必须是无规律的小变化)

5.差分

时间序列t时刻的值和t-1时刻的值差d构造的新序列为一阶差分。再对其进行相同的差分运算,可以得到二阶差分。
通常非平稳的序列可以经过d阶差分得到弱平稳或近似弱平稳的时间序列。
ARIMA(p,d,q)模型:p为自回归滞后项,q阶滑动平均滞后项,d阶差分。

6.相关系数

反应两个空间中两个向量之间相关关系密切程度的统计指标。

7.自相关函数(ACF)

某随机信号再不同时刻的取值之间的相关程度。

8.偏自相关函数(PACF)

阶次为s的偏自相关:去除信号中所有滞后期小于s的信号影响后,当前信号与滞后s阶的信号之间的关系。

9.ARIMA模型参数选择

9.1.检查序列是否平稳

			若不平稳,使用差分平稳化序列,确定差分阶数d

9.2.ARMA定阶

			通过PACF确定AR的阶数p
			通过ACF确定MA的阶数q

9.3 根据参数p,d,q建立模型ARIMA(p,d,q)

10.案例:股票数据分析

10.1 步骤

		准备数据、可视化数据审查数据、处理数据、根据ACFPACF定阶、拟合ARIMA模型、预测

10.2 代码及注释

# -*- coding: utf-8 -*-


import pandas as pd
import pandas_datareader
import datetime
import matplotlib.pylab as plt
from matplotlib.pylab import style
from statsmodels.tsa.arima_model import ARIMA
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf

style.use('ggplot')     # 设置图片显示的主题样式

# 解决matplotlib显示中文问题
plt.rcParams['font.sans-serif'] = ['SimHei']  # 指定默认字体
plt.rcParams['axes.unicode_minus'] = False  # 解决保存图像是负号'-'显示为方块的问题


def run_main():
    """
        主函数
    """
    # 1. 准备数据
    # 指定股票分析开始日期
    start_date = datetime.datetime(2007, 1, 1)
    # 指定股票分析截止日期
    end_date = datetime.datetime(2017, 3, 1)
    # 股票代码
    stock_code = '600519.SS'    # 沪市贵州茅台

    stock_df = pandas_datareader.data.DataReader(
                        stock_code, 'yahoo', start_date, end_date
                )
    # 预览数据
    print(stock_df.head())

    # 2. 可视化数据
    plt.plot(stock_df['Close'])
    plt.title('股票每日收盘价')
    plt.show()

    # 按周重采样
    stock_s = stock_df['Close'].resample('W-MON').mean()
    stock_train = stock_s['2014':'2016']
    plt.plot(stock_train)
    plt.title('股票周收盘价均值')
    plt.show()

    # 分析 ACF
    acf = plot_acf(stock_train, lags=20)
    plt.title("股票指数的 ACF")
    acf.show()

    # 分析 PACF
    pacf = plot_pacf(stock_train, lags=20)
    plt.title("股票指数的 PACF")
    pacf.show()

    # 3. 处理数据,平稳化数据
    # 这里只是简单第做了一节差分,还有其他平稳化时间序列的方法
    # 可以查询资料后改进这里的平稳化效果
    stock_diff = stock_train.diff()
    diff = stock_diff.dropna()
    print(diff.head())
    print(diff.dtypes)

    plt.figure()
    plt.plot(diff)
    plt.title('一阶差分')
    plt.show()

    acf_diff = plot_acf(diff, lags=20)
    plt.title("一阶差分的 ACF")
    acf_diff.show()

    pacf_diff = plot_pacf(diff, lags=20)
    plt.title("一阶差分的 PACF")
    pacf_diff.show()

    # 4. 根据ACF和PACF定阶并建立模型
    model = ARIMA(stock_train, order=(1, 1, 1), freq='W-MON')
    # 拟合模型
    arima_result = model.fit()
    print(arima_result.summary())

    # 5. 预测
    pred_vals = arima_result.predict('20170102', '20170301',
                                     dynamic=True, typ='levels')
    print(pred_vals)

    # 6. 可视化预测结果
    stock_forcast = pd.concat([stock_s, pred_vals], axis=1, keys=['original', 'predicted'])

    plt.figure()
    plt.plot(stock_forcast)
    plt.title('真实值vs预测值')
    plt.savefig('./stock_pred.png', format='png')
    plt.show()


if __name__ == '__main__':
    run_main()
  • 2
    点赞
  • 47
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值