更多机器学习关注公众号。
引言
目前,深度学习在计算机视觉和语音识别上有了非常广泛的应用,但是在工业应用方面还没有完善的体系,一方面缺乏数据集另一方缺乏优秀的顶级论文。在工业上的故障诊断领域,大多数据都来自于传感器的采集,如是西储大学轴承数据,TE化工数据集等,都是典型的时间序列,因而绝大多数问题可以抽象成时间序列分类(TSC)问题。因此本人准备从时间序列分类出发,用典型的深度学习方法,如多层感知器,卷积神经网络,递归神经网络等去测试UCR数据集(共128个时间序列数据集)和自己仿真的时间序列,由此得到一些启发和规律,再将这些知识迁移到工业上的故障诊断领域。为了方便大家阅读和复现代码,本文就不再有过多的数学推到,多以代码和如何使用代码为主,用最直观的方式去解释一些实验结果。
数据集
在时间序列的数据集中,最权威的就属UCR Time Series,可以说是时间序列界的“Imagnet”,发文章必跑数据集,有一堆大牛在维护,并在2018年秋对其进行了意思大的更新。这个数据集很有意思,下载后解压密码要仔细读其PPT然后在其参考论文中寻找,如果想懒省事的朋友可以直接从这里下载。此数据集包含了128个时间序列数据集,下图为前八个
除了前人整理好的数据集数据集,我们在初期还可以自己设计一些简单的,容易识别的数据集来进行入门以及算法的初步筛选。不仅如此,为了探究模型结构的设计所考虑的因素或者验证自己的猜想,都需要有针对性的设计一些时间序列。比如一些单变量时间序列如:
方波,正弦波,锯齿波,等等,如下图所示
一些简单的多变量时间序列如下图所示