1.问题描述
时间序列数据作为一种典型的数据,常存在于各行各业。比如客流、车流、销量、KPI指标等等。
如何对时序数据加以利用,比如做未来预测,交通拥堵分类等问题。在采用机器学习算法之前,首先需要我们构建特征。因为大多数时序数据都是单变量或者维度特别少,所以特征的构建就比较重要。
笔者总结了几种特征,供大家参考,有更好的思路,非常欢迎提出来大家一起探讨。
2.特征构建
常见的时序数据格式如下:
时间time | 对象value |
---|---|
2019-01-01 | 1234 |
2019-01-02 | 2334 |
2019-01-03 | 4324 |
2019-01-04 | 5314 |
2019-01-05 | 5890 |
2019-01-06 | 6782 |
… | … |
对于上述这种单变量时序数据,如何构造特征呢?也不外乎两点,时间和对象:</