WHEN: AWavelet-DTW Hybrid Attention Network for Heterogeneous Time Series Analysis KDD2023

 WHEN: AWavelet-DTW Hybrid Attention Network for Heterogeneous Time Series Analysis                 

由于其广泛的应用,时间序列分析得到了大量的研究关注,但仍然是一项非常具有挑战性的任务。近年来,深度学习方法(如CNN和RNN)在时间序列分类和预测方面取得了巨大成功,但异质性作为时间序列的本质尚未得到充分解决,仍然是性能的“绊脚石”。鉴于此,我们认为序列内非平稳性和序列间异步性是多时间序列中广泛存在的两种异构类型并提出了一种称为WHEN的混合注意网络作为深度学习解决方案WHEN在两个不同的模块中具有两种注意机制。在WaveAtt模块中,我们提出了一种新的数据相关小波函数,并将其作为小波注意集成到BiLSTM网络中,用于分析非平稳时间序列中的动态频率成分

在DTWAtt模块中,我们将动态时间翘曲(DTW)技术转化为DTW注意的形式,将所有输入序列与一个通用参数序列同步,以克服多时间序列中的时间失真问题。然后将具有混合关注的WHEN形成任务相关神经网络,用于分类或预测任务。在30个UEA数据集和3个具有丰富竞争基线的真实数据集上进行的大量实验表明,我们的模型具有优异的性能。通过专门设计的分析,详细探讨了when处理时间序列异质性的能力。

1. 背景

论文认为时间序列的异质性包含了两个棘手且广泛存在的现象,即序列内非平稳性序列间非同步性。如图 1 所示。

序列内非平稳性源于同一个时间序列的不同部分具有固有的异质性特征,例如均值、方差、频率成分等。子图a给出了一个关于心电图(ECG)时间序列的示例,其中 QRS 波群部分(具有高变化频率和幅度)和 T 波部分(具有低变化频率和幅度)明显具有不同的频率成分。

序列间非同步性则指的是时间序列之间的非同步现象,可能由异构的采样率或相位扰动引起。子图 b 所示的示例中,同一类别中的两个心电图时间序列由于具有不同的采样率和初始相位,很可能被归类为不同的类别。这是时间序列分类问题中的常见现象。

 

方法

1)总体框架

为了应对上述挑战,论文提出了 Wavelet-DTW Hybrid attEntion Networks(WHEN),用于对异质时间序列的分析。WHEN 本质上是一个混合注意力网络,将小波变换和动态时间规整算法通过注意力机制进行整合。WHEN 的框架如图 2 所示,包含两个核心模块。

小波注意力(WaveAtt)模块的关键组件是与局部数据相关的小波函数,其中小波函数的频率由局部信号序列确定,该模块通过动态提取输入序列的异质频率成分来减少序列内非平稳性的问题。

动态时间规整注意力(DTWAtt)模块则通过局部动态时间规整注意力处理信息,模块将动态时间规整算法与注意力机制结合,用于处理序列间非同步性的问题。

这两个模块通过任务相关的神经网络(TD-NN-1 和 TD-NN-2)以端到端的方式连接成一个流水线形式的模型,用于时间序列分类或预测任务。

▲ 图2 WHEN 结构示例

2)小波注意力模块

小波注意力(WaveAtt) 模块基于经典的小波频率分析并结合神经网络,能够在每个时间点提取不同频率对应的小波系数

 小波注意力:传统方法通常手动设置 为一组离散数,从而覆盖所有可能的整数频率带,这显然无法发挥小波基提取任意频率的系数这一功能。同时,时间序列数据的内部非平稳性意味着这些信号数据具有随时间动态变化的频率参数,因此在不同情况下提取不同频率对应的小波系数是一件有必要的事。

3)动态时间规整注意力

动态时间规整注意力中,论文通过注意力的方式使原本的动态时间规整方法具备可导性,同时支持现有深度学习环境下的大矩阵运算。 

图 4 中,动态时间规整注意力模块的输入记为序列 ,这里论文采用一个滑动窗口覆盖输入序列 ,形成了图中的 ,而图中的 则是一个可学习的参数序列。

因为每个滑动窗口采样后的 和 长度是有限的,所以它们对应的规整方式也是有限的(同时在滑动窗口长度较短时,规整方式总数目也并不大),假设总共有 种不同的规整方式,它们对应的 种规整距离可以写为

这时可以通过注意力机制选取近似的最小距离

具有较短距离 的规整方式具有较大的注意力系数 ,因此,在输出 b 中,具有较短距离的规整方式将获得更多的关注。这样,动态时间规整注意力依然寻找到了最短的规整距离,并将其以神经网络的方式实现出来。

Task I: Time Series Classification 

 

 Task II: Time Series Forecasting

 

 

总结:1)这篇论文挺意思的,从频域角度考虑了同一条时间序列内存在不同频域特征 2)在多元时间序列中存在不同单序列之间不对齐或者 因为采样率问题,导致序列之间没有办法对齐,这些问题在序列中是很常见的,但是文中很好的将这两个问题融合在一起。并集成到下游任务的时间序序列预测与分类任务中。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值