001_论文笔记

最新推荐文章于 2023-12-21 16:47:52 发布

墨鱼mo

最新推荐文章于 2023-12-21 16:47:52 发布

阅读量1.5k

点赞数

分类专栏：论文笔记文章标签：深度学习

本文链接：https://blog.csdn.net/weixin_45553275/article/details/123608432

版权

论文笔记专栏收录该内容

1 篇文章 0 订阅

订阅专栏

论文指出Transformer在时间序列预测中存在对局部信息不敏感和计算复杂度过高的问题。为了解决这些问题，作者提出了使用因果卷积来捕捉局部上下文，以及采用稀疏注意力机制降低计算复杂性。实验结果表明，这些改进在实际和合成数据集上的预测性能都有所提升，特别是在处理长期依赖关系和大规模时间序列时更具优势。

摘要由CSDN通过智能技术生成

Enhancing the Locality and Breaking the Memory Bottleneck of Transformer on Time Series Forecasting记录对这篇论文的理解

论文提出transformer在预测长时间序列中存在的两个问题：

1、transformer对局部信息不敏感，

2、transformer对于长时间序列的计算复杂度太高

作者提出两种方法利用因果卷积（只使用当前数据以前时间点的值）产生K和Q来捕捉局部信息，提出稀疏注意力机制来减小计算复杂度。

之前的深度神经网络RNN在解决长时间依赖的序列问题上存在梯度爆炸和梯度消失问题。改进的LSTM，用LSTM的语言模型的有效上下文大小平均约为200个标记，但只能清楚地区分附近的50个标记，这表明即使是LSTM也难以捕获长期依赖关系。所以对长期依赖如何建模是非常重要的。

这个和之前的DeepAR（是一种针对大量相关时间序列统一建模的预测算法，该算法使用递归神经网络 (RNN) 结合自回归(AR) 来预测标量时间序列，在大量时间序列上训练自回归递归网络模型，并通过预测目标在序列每个时间步上取值的概率分布来完成预测任务。）的概率预测有点相似。使用的数据集是差不多的。深度神经网络已经被提出用来捕捉相关时间序列中的共享信息，以便进行准确的预测。

对于第一个问题：