长时间序列预测模型Informer

【概念】

"Informer" 是一种时间序列预测模型。它是一种用于处理时间序列数据的深度学习模型,特别适用于长期依赖和具有多时间尺度的时间序列预测任务。Informer模型结合了Transformer和自注意力机制以及卷积神经网络(CNN)的特点,具有较好的建模能力。

Informer模型在时间序列预测领域具有广泛的应用。它可以用于许多任务,例如天气预测、交通流量预测、股票价格预测等。通过学习输入序列的内在模式和规律,Informer可以对未来的时间序列进行准确的预测。

【模型结构】

在一次反向传播就可输出复数的值。与transformer比较有①层数比transformer的少很多②经过注意力机制时压缩数据的维度③不需要多次的预测就可以输出复数的值④比transformer轻量

Encoder的作用是Self-attention Distilling,由于ProbSparse自相关机制有很多都是用V的mean填充的,所以天然就存在几余的attention sorce,因此在相邻的Attention Block之间应用卷积与池化来对特征进行下采样,所以作者在设计Encoder时,采用蒸馏的操作不断抽取重点特征,从而得到值得重点关注的特征图。论文中提到一种新的EncoderStack结构,由多个Encoder和蒸馏层组成。

其中序列的压缩是通过卷积层来实现的。

【稀疏注意力机制】

在长序列中,并不是每一个位置的attention都很重要。

如下图,纵坐标为Q,横坐标为K。每一行即为一个Q与所有K相关性的结果。红色部分就是·-个“积极”的Q,我们可以从图中明显看出它和哪个K相关性较高。
绿色部分就是一个“懒惰”的Q,它和所有的K关系都很“一般”

在实际计算中,这些“懒惰”的Q不仅无法提供有效的价值,而且在Q里大部分都是这些”懒惰”的家伙
只选取”积极”的Q来计算注意力机制,而舍弃掉”懒惰”的Q的想法随之诞生。这就是Informer论文的核心:ProbSparse Attention

在统计学中,抽样数据集分布能够代表整体数据集。ProbSparse Attention采取了和均匀分布相比较的思路。均匀分布就像上图中的虚线部分,是一条直线。对于每个Q计算它和均匀分布的差异,差异越大就越”活跃”。(随机抽取1/4,每个Q和1/4的K之间的相关性(96*96 —> 96*25)、得到了所有的Q是否活跃的排序,找到分布差异最大的top25个Q)

 衡量两种分布的距离,使用KL散度

【总结】

Informer算法是深度学习领域的一项重要创新,特别针对处理长序列时间序列数据而设计。作为传统Transformer模型的一个高效改进,Informer主要通过引入概率稀疏注意力机制(ProbSparse Self-Attention)来解决处理长序列时的效率和性能问题。这种机制使得Informer在保持出色性能的同时,大幅减少了对计算资源的需求。此外,Informer采用了一种独特的序列下采样策略,有效地减少了序列的长度,从而进一步提升了处理长序列的能力。为了捕捉时间序列中的长期依赖关系,Informer还引入了多尺度时间编码技术,使得模型能够同时理解短期和长期的时间动态。

  • 7
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: Informer模型是一种基于自注意力机制的序列预测模型模型有多个层级,每个层级包含多个自注意力机制,其中每个自注意力机制由多个头部组成,可以并行处理序列信息。模型还具有提取序列特征的卷积层和利用门控机制进行特征融合的Transformer模块。最终输出的预测结果由多个Transformer模块组成的编码-解码结构生成。 该模型的特点在于采用了基于多头注意力机制的自编码器来进行序列预测。在训练过程中,模型使用teacher-forcing方法,即将正确答案作为输入来生成输出序列。特别的,在生成下一个时间步的输出时,模型不仅能够对当前时间步的状态进行预测,还能考虑历史状态和未来状态之间的关联,从而提高预测的准确性和稳定性。该模型在多个时间序列预测任务中表现出色,并可用于研究和应用领域,如气象预测、电力负荷预测等。 在使用Informer模型时,需要根据具体的问题选择合适的超参数进行调整。例如,需要选择恰当的层数、头数、逐位置前馈神经网络的隐藏层维度等,以及训练时的批量大小和学习率等。对于历史和未来时序数据的输入,需要使其在模型训练和测试时保持一致的度,同时需要对输入数据进行归一化处理以便更好地训练模型和提高预测效果。 ### 回答2: informer模型文档是指描述informer模型的详细说明文档。informer是一种用于时间序列预测的深度学习模型,特别适用于具有期依赖关系的时间序列数据。 informer模型文档通常包括以下内容: 1. 模型结构:介绍informer模型的整体结构,包括图像或示意图,并解释每个组件的作用。 2. 输入和输出:说明informer模型的输入和输出形式。输入可以是时间序列数据的历史观测值,输出可以是未来时间点的预测值。 3. 模型参数:列出informer模型中使用到的各种参数,例如隐藏层的维度、注意力机制的类型及参数等。对每个参数进行详细解释,包括其作用和调整方法。 4. 训练过程:描述informer模型的训练过程,包括损失函数的选择、优化器的使用、学习率的调整策略等。 5. 模型评估:说明如何评估informer模型的性能,例如使用的评估指标、测试数据集的选择等。 6. 超参数调优:解释如何调整informer模型中的超参数,以获得更好的性能。 7. 应用示例:列举一些informer模型应用的实例,介绍模型在实际场景中的应用效果。 8. 附录:包括一些额外的信息,例如informer模型的理论基础、相关研究领域的背景知识等。 总之,informer模型文档提供了对该模型的全面了解,帮助用户理解和使用该模型,并为进一步研究和改进提供指导。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值