文章目录
1. 背景
时间序列数据(time series data)是在不同时间上收集到的数据,用于描述现象随时间变化的情况。时间序列是一种典型的数据,具有随时间变化的特征。在大多数场景中,都能见到的一种数据类型。如客流数据,股票数据,销售额数据,网络日志,某些KPI指标等等内容。
时间序列数据格式:(单变量)
Time | Value |
---|---|
2018-11-01 | 2222 |
2018-11-02 | 3241 |
2018-11-03 | 4232 |
… …
2. 时间序列预测方法
首先我们要有个目标,想通过时间序列数据完成什么样的目标,短期、中期、长期预测,单步、多步,单变量,多变量。然后需要尽可能的收集时间序列数据,数据越多,能够发现更多数据特征,预测会更准确。
时间序列需要对数据中的缺失、异常、范围等进行处理。并且如何可以将预测问题转换为分类问题,则预测的难点会大大降低。
常见的时间序列数据预测方法,主要总结一下几种:
- 简单平均法
- 移动平均法
- 指数平均法
- ARIMA法
- Prophet法
- 线性回归、KNN等机器学习算法
- LSTM等深度学习算法
下面主要对其中几种方法进行介绍,其他方法提高参考链接,可自行学习。
3. ARIMA
ARIMA模型全称为自回归移动平均模型(Autoregressive Integrated Moving Average Model,简记ARIMA),其中ARIMA(p,d,q)称为差分自回归移动平均模型,AR是自回归, p为自回归项; MA为移动平均,q为移动平均项数