时间序列+即插即用注意力模块!只需几行代码,预测误差狂降35.99%

即插即用的注意力模块可以显著提高时间序列预测模型的性能和准确性,同时保持模型的简洁和高效。

与传统的时序模型相比,注意力模块通过自适应处理输入数据的特征,以增强特征提取和空间/时间感知的能力。同时它可以很容易地集成到现有的深度学习架构中,作为一个独立的组件,即插即用,无需对整个模型架构进行大的改动。

因此,这种注意力模块通常具有更少的参数和计算量,可以专注于序列中最重要的部分,忽略无关或噪声数据,从而更准确地预测未来的趋势或事件。比如只需几行代码就能降低35.99%均方误差的FECAM。

为帮助同学们理解,本文整理了8种即插即用的时间注意力模块及其变体,有2024最新的,也有经典必看的,模块原文以及开源代码已附,方便同学们复现。

论文原文以及开源代码需要的同学看文末

频率增强信道注意力

FECAM: Frequency Enhanced Channel Attention Mechanism forTime Series Forecasting

方法:论文提出了基于离散余弦变换的频域增强通道机制(FECAM),可以避免由于有问题的周期性导致的高频噪声。通过在频域建模,FECAM可以给不同通道分配通道权重,并学习每个通道不同频率的重要性,从而学习时间序列的频域表示。

该模块可以提高现有主流网络的预测能力,只需几行代码,即可在LSTM上降低35.99%的MSE,在Reformer上降低10.01%,在Informer上降低8.71%,在Autoformer上降低8.29%,在Transformer上降低8.06%等,计算成本很小。

创新点:

  • 引入离散余弦变换(DCT)来获取更多频率成分的时间序列信息。

  • 设计了频率增强通道注意力机制(FECAM),可以作为独立的预测模型或添加到其他主流模型中,提高它们的预测性能。

线性时间序列预测

UnetTSF: A Better Performance Linear Complexity Time Series Prediction Model

方法:论文提出了一种具有线性复杂度的长时间序列预测模型UnetTSF。它提出了一种适用于时间序列数据的FPN描述结构,成为原始数据描述和二进制分解方法的第三种选择。UnetTSF将Unet网络结构引入时间序列预测领域,并设计实现了一种适用于时间序列预测的Unet网络。在32项测试中,它有31项优于最佳线性模型DLiner,平均降低了10.1%的均方误差和9.1%的平均绝对误差,在时间序列预测任务中展现了卓越的性能和线性复杂度优势。

创新点:

  • FPN描述结构:该论文首次提出了一种适用于时间序列数据的FPN描述结构,利用池化函数对数据进行多层操作,从不同深度提取趋势信息,并共同形成一个数据组,以取代原始数据。这种描述结构能够更好地捕捉时间序列数据的特征。

  • 引入Unet网络结构:该论文将Unet网络结构引入时间序列预测领域,并设计实现了适用于时间序列预测的Unet网络。通过与DLiner和PatchTST等复杂模型的对比实验,证明了UnetTSF具有更优越的性能。UnetTSF具有线性复杂度,更适用于实际生产和生活。

因果时间注意力

CityCAN: Causal Attention Network for Citywide Spatio-Temporal Forecasting

方法:论文提出了一种用于城市范围内时空预测的Causal Attention Network (CityCAN)。CityCAN利用因果理论来发现城市范围内的有用的时空相关性,并通过隐式干预在潜在层面上学习有用的区域相关性。

为了同时捕捉普通和非规则区域的时空相关性,CityCAN引入了一个全局-局部注意编码器,通过校准的注意机制来捕捉本地和全局的时空相关性。为了使CityCAN能够一次准确预测城市中所有区域的目标特征,论文还提出了一种考虑预测和实际条件之间的城市范围分布的城市范围损失。

创新点:

  • 提出了CityCAN,一种用于城市范围ST预测的因果注意网络,利用因果理论揭示了时空相关性。

  • 引入了全局局部关注编码器,用于更好地建模空间和时间依赖关系。

  • 设计了一种城市范围损失函数,通过考虑城市中所有区域的预测分布,实现了更好的城市范围ST预测。

金字塔时间注意力

PYRAFORMER: LOW-COMPLEXITY PYRAMIDAL ATTENTION FOR LONG-RANGE TIME SERIES MODELING AND FORECASTING

方法:本文提出了一种基于金字塔注意力的Pyraformer模型,通过多分辨率表示来捕捉时间序列的不同范围的时间依赖关系。具体来说,作者引入了金字塔注意力模块(PAM),其中的跨尺度树结构总结了不同分辨率的特征,而内部尺度的相邻连接则模拟了不同范围的时间依赖关系。在一定条件下,Pyraformer的信号传播路径的最大长度是一个常数(即O(1)),而其时间和空间复杂度与序列长度L成线性关系。

创新点:

  • 提出了Pyraformer模型,通过探索时间序列的多分辨率表示来构建一个灵活而简洁的模型,能够捕捉广泛的时间依赖关系。

  • 引入了金字塔注意力机制,通过在金字塔图中基于注意力进行消息传递来构建。金字塔图中的边可以分为两组:跨尺度连接和内部尺度连接。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“时间注意力”获取全部论文+代码

码字不易,欢迎大家点赞评论收藏

  • 0
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,以下是一个简单的Java小商店代码及其解释: ```java import java.util.Scanner; public class Store { public static void main(String[] args) { Scanner input = new Scanner(System.in); String[] items = {"T-shirt", "Jeans", "Sneakers", "Hat"}; // 商品列表 double[] prices = {20.99, 35.99, 49.99, 12.99}; // 商品价格列表 System.out.println("Welcome to our store!"); System.out.println("Here are the items we have:"); for (int i = 0; i < items.length; i++) { System.out.println((i+1) + ". " + items[i] + " - $" + prices[i]); // 输出商品列表及价格 } System.out.print("Please enter the number of the item you want to buy: "); int choice = input.nextInt(); // 用户选择要购买的商品编号 System.out.print("Please enter the quantity you want to buy: "); int quantity = input.nextInt(); // 用户选择要购买的商品数量 double total = prices[choice-1] * quantity; // 计算总价 System.out.println("You want to buy " + quantity + " " + items[choice-1] + "(s), which will cost you $" + total); } } ``` 代码解释: 1. 导入`java.util.Scanner`类,以便从控制台读取用户输入。 2. 创建一个`items`数组来存储商店的商品列表,以及一个`prices`数组来存储对应商品的价格。 3. 输出欢迎信息,以及商品列表及价格。 4. 从控制台读取用户想要购买的商品编号和数量。 5. 根据用户选择的商品编号和数量计算总价。 6. 输出用户选择的商品及总价。 这个小商店程序非常简单,只是演示了如何使用数组来存储商品列表及其价格,并从控制台读取用户输入,最后输出最终结果。当然,实际应用中要考虑更多的功能和异常处理。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值