时间序列分类比较麻烦是因为我们用于模型训练的数据的每条样本一般是一个特征向量x对应一个y的形式,而时间序列的大量的信息藏在它的结构中,不仅仅体现在数值上。没意识到这一点的话,我们提取的特征可能就没有什么价值。(其实意识到了也没用,因为还是不会处理。)
总结
-
通过把K近邻(K=1)和动态时间规整距离结合起来,能得到一个效果突出的时间序列分类器,解决了很多人面对时间序列无所下手的问题。有兴趣的读者可以试试K为其它值的情况;
-
由于是用了KNN,就有KNN的老毛病——计算时间复杂度高。我们可以通过在计算DTW距离时缩小规划窗口来提升算法的速度.
详细参考此链接: