TFT:Temporal Fusion Transformers for Interpretable Multi-horizon Time Series Forecasting

TFT模型是一种基于注意力机制的多步时间序列预测模型,强调可解释性和特征选择。它利用LSTM和多头注意力来处理局部和全局信息,并采用门控机制和特征选择网络。模型输入包括观测输入、已知输入、静态输入等,输出为不同分位数的预测值。损失函数为分位数损失,模型参数包括隐藏层大小、学习率等。
摘要由CSDN通过智能技术生成

1 模型简述

tft模型具有下面特征:

  • 支持多个时间序列
  • 基于注意力的模型结构
  • 具有可解释性
  • 特征选择,并使用门控进行特征压缩,速度快

1.1 输入

输入数据为df格式,列可分为下面六类

  • target:预测目标值
  • observed inputs:观测输入,比如上一时刻的值等,无法提前知道的
  • known inputs:已知输入,比如年月日,节假日等,可以提前知道的
  • static input:静态输入,比如商店的地址等,不会变化的
  • id:时间序列编号,不作为模型输入,只作为索引
  • time:时间索引,不作为模型输入,只作为索引

1.2 输出

各分位数的预测值:
比如:quantiles = [0.1, 0.5, 0.9]
模型就会给出0.1,0.5,0.9分位数的预测值

2 损失函数

分位数损失函数
在这里插入图片描述

3 模型结构

在这里插入图片描述
说明:

  • Variable Selection is used for judicious selection of the most salient features based on the input. ----特征选择可以从输入中选择更显著的特征
  • Gated Residual Network blocks enable efficient information flow with skip connections and gating layers. ----GRN中的跳跃连接和门控层可以使信息流通更有效率,模型训练速度更快
  • Time-dependent processing is based on LSTMs for local processing, and multi-head attention for integrating information from any time step.

3.1 基本结构

评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值