Data augmentation using synthetic data for time series classification with deep residual networks
利用合成数据进行时间序列分类的数据扩充方法
Abstract
数据增强技术在计算机视觉方面使用的十分广泛,对于样本数量较少的数据集来说模型很容易达到过拟合,使用数据增强技术可以有效的见识过拟合的程度。然而在时间序列分类方面的数据增强技术很有限,作者提出了一种基于DTW距离的数据增强技术来填补这一方面的空白。
Introduction
对于图片来说数据增强技术取得了不错的效果,然而应用在时间序列方面效果却并不理想。这可能是因为,对于图片来说数据增强之后并不会改变图片的类别,例如一张猫的图片,通过对图片进行平移,旋转,缩放等变换并不会将猫变为狗,而对于时间序列来说人们无法轻易地控制这种特殊转换对时间序列性质的影响。
本文提出了一种基于DTW的时间序列增强技术,通过在UCR数据集上进行实验,实验结果表明数据增强可以极大地提高神经网络模型对某些数据集的精度,同时对其他数据集有较小的负面影响。最后,提出将这两种训练模型的决策结合起来,说明如何在保证数据集的高增益精度的同时,有效地减少数据增加带来的罕见的负面影响。
Method
- Architectur