1、时序分析基本思路
时序数据种类
- 白噪声序列:没有预测的价值
- 平稳非白噪声序列:AR、MA、ARMA
- 非平稳序列:ARIMA
变量因素
- 单变量时序:ARMA --> GARCH
- 多变量时序:VAR --> MGARCH
待分析时序数据思路(AR/MA/ARMA/ARIMA)
ACF | PACF | 模型选择 |
---|---|---|
截尾 | 拖尾 | MA |
拖尾 | 截尾 | AR |
拖尾 | 拖尾 | ARMA |
截尾:某阶之后等于0
拖尾:某阶之后趋向于0
2、时序模型诊断/检验
模型诊断的目的
- 准确性
- 改进方向
模型诊断的方法
- 一元:残差分析、过度拟合
- 多元:残差交叉相关性、多元混成统计
残差分析:时间序列拟合效果好则为白噪声序列
step1.残差图:均值为0
- 是否具有趋势
- 是否具有异常波动
step2.残差正态性检验:满足正态分布
- QQ图:若满足正太分布则接近直线、中间密,两头疏
- shapiro-wilk正态性检验:W --> P
step3.残差自相关:没有自相关
- ACF图:绝对值与2/sqrt(n)对比,若没有大于则称没有提供残差非零自相关系数在统计上显著的证据
- Ljung-Box 检验
过度拟合
- 额外参数不显著的不为0
- 共同参数与原始估计相比无显著改变
避免参数冗余的方法
- 简单模型先检验
- 模型逐渐复杂化
- 根据残差分析的线索进行模型扩展
3、时序异常检测
比较常见的时序异常检测方法
- 基于统计:某时刻值偏离某段时间的均值和方差值超过定义的阈值。
- Autoregressive Moving Average(ARMA):预测未来时间的值,如果偏离正常值一定阈值,认定异常
- One-Class SVM:根据正常点判断新的时间是否为异常
- KNN:邻近的样本数量,或近邻的样本距离计算其异常
- AutoEncoder或者PCA降维:根据重构误差来计算是否异常,假设异常在重构时会丢失信息