学习记录(三)——时间序列预测方法
ARMA/ARIMA
自回归滑动平均模型(auto regressive moving average model,ARMA)只能针对平稳数据进行建模,只能支持对单变量历史数据的回归,处理不了多变量的情况。
差分整合移动平均自回归模型(autoregressive integrated moving average model,ARIMA)是ARMA的改进版,需要先对数据进行差分,差分平稳后在进行建模。
机器学习方法
使用机器学习方法,需要先进行特征工程。【参考:深度了解特征工程 - 知乎 (zhihu.com)】
-
数据预处理:
数据清洗:包括缺失值、异常值、重复值处理,数据格式的转换,数据采样区间的选择等。
特征转换:对于连续变量进行特征缩放、无量纲化、归一化、二值化等,对于离散变量进行数值化、哑编码等,对于时间序列进行时间戳处理,即对于时间维度的选取与选取与处理。
-
特征选择:
特征检验:对于单变量进行正态性检验、显著性分析;对于多变量进行一致性检验、多重共线性检验;对于时间序列进行协整检验(分析时间序列的非平稳性