1.15 python/pandas时间序列和ARIMA(1)

为了公司可能工作,把之前学的时间序列用python再整一遍。
- Python进行时间序列主要用到pandas statsmodels sklearn
- pandas-datareader很有用,可以访问到yahoo 和googe finance, 还有世界银行和纳斯达克。
- tsfresh包进行序列模型特征提取,非常方便,好建模;比如异常检测模型

ARIMA:
ACF: 相隔一段时间的前后两个序列相似程度(相关系数)
PACF:
- ACF建立的y(t)和y(t-x)之间关系不单纯, 受中间量如y(t-1)的影响, 我们对误差进行建模, 以此来消除中间(x-1)个量的影响,PACF之后是严格y(t)和y(t-x)相关关系

具体步骤:
- EDA看图
- 填补missing值
- 去除趋势,季节因素
- 平稳性检测;平稳的话看看是不是白噪声(
证明序列是否为平稳序列有两种方法,一种就是上面说的图像法,另一种是单位根检验,比如ADF test。)
- Arima:acf, pacf; 模型的拟合;
- ARIMA模型检验:
- 残差是否平均值为0并且方差为常数的正态分布(白噪声)
- Ljung-Box检测: 原假设为噪声是白噪声; P>0.5接受就好
- 与预测(可以用RMSE来看模型好坏);
- arch效应检验(有的话需要用波动率模型建模)

总的来说就是确定性因素的分解—随机因素的均值建模—波动率建模。

附录:
1. ARIMA参数选择:

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值