时频变换是常见的信号分析思路,同样可用于数据增强。在频率域添加噪声是方法之一。比如可以对传感器信号应用短时傅里叶变换STFT得到具有时序关系的谱特征,再在谱特征上应用两种数据增强方法。一是对每一个属性做局部平均,将局部平均序列拼接在原始序列的后面;二是打乱时序顺序,以增加数据的方差,这种方法会使得数据尺寸发生变化。由于STFT 变换得到的谱特征仍然具有时序关系,这种数据增强方法也被认为是在时间-频率域上进行的。
赋值调整傅里叶变换AAF及由其衍生的IAAFT可实现只在频率域进行数据增强,这类方法很好地保留了时域和频域特征,但不适合短周期信号。
对于音频数据,SpecAugment是一种在时间-频率域上做数据增强的方法,在信号的对数梅尔频谱上操作。下图a展示了一段信号的对数梅尔频谱,频谱图的横轴是时间轴,纵轴是频率大小。在时间轴上,可以进行时间规整或时间掩蔽,分别如图(b)和图(c)。
时间规整是在序列中随机选择一个时间点,拉伸该点之前(之后)的信号,压缩该点之后(之前)的信号,保证序列的长度不发生改变;时间掩蔽是在整个序列中用指定值填充一随机片段。在频率轴也可以进行类似的掩蔽操作,形成图(d)的效果,被称为频率掩蔽。实验证明该方法在语音识别任务上可以显著降低字错误率。上述方法都是针对单个序列做数据增强,生成的效率更高,但只利用序列本身的性质,没有考虑数据集整体的分布。
mbd.pub/o/GeBENHAGEN
擅长现代信号处理(改进小波分析系列,改进变分模态分解,改进经验小波变换,改进辛几何模态分解等等),改进机器学习,改进深度学习,机械故障诊断,改进时间序列分析(金融信号,心电信号,振动信号等)