今天看了一下唐宇迪的时间序列分析,对时间序列有了初步的认识。
这里总结一下一些相关知识
首先时间序列即以时间未变化(x轴)的一系列数据。
这个数据可能变化的情况非常剧烈,所以不便于分析,我们希望它能反应出稳定的变化趋势,这时候便有了ARIMA模型,这个模型主要反映的还是数据的以时间为横轴的差分变化情况,一阶差分即将t时刻数据值减去t-1时刻数据值得到的数据,这样得到的数据会更稳定,二阶差分即在一阶差分的基础上再次进行差分,一般都是1-2阶差分。
然后是滑动窗口,这个类似于卷积的窗口,不断从过去以某个长度的窗口向右滑动,这个窗口内的值可以取平均值,也是使数据变得平稳,这里的滑窗的功能和数据竞赛中的滑窗的功能虽然有所区别,但是核心思想都是一样的。
ARIMA模型其实就是一种预测时间序列变化趋势的模型,同sklearn中模型使用方法类似,在对数据进行处理(平滑)后进行fit,然后predict.一般都是predict数值,如果是分类,建议调用tsfresh库进行时间序列特征提取,然后用传统机器学习模型进行分类。