tft
1 模型简述
tft模型具有下面特征:
- 支持多个时间序列
- 基于注意力的模型结构
- 具有可解释性
- 特征选择,并使用门控进行特征压缩,速度快
1.1 输入
输入数据为df格式,列可分为下面六类
- target:预测目标值
- observed inputs:观测输入,比如上一时刻的值等,无法提前知道的
- known inputs:已知输入,比如年月日,节假日等,可以提前知道的
- static input:静态输入,比如商店的地址等,不会变化的
- id:时间序列编号,不作为模型输入,只作为索引
- time:时间索引,不作为模型输入,只作为索引
1.2 输出
各分位数的预测值:
比如:quantiles = [0.1, 0.5, 0.9]
模型就会给出0.1,0.5,0.9分位数的预测值
2 损失函数
分位数损失函数
3 模型结构
说明:
- Variable Selection is used for judicious selection of the most salient features based on the input. ----特征选择可以从输入中选择更显著的特征
- Gated Residual Network blocks enable efficient information flow with skip connections and gating layers. ----GRN中的跳跃连接和门控层可以使信息流通更有效率,模型训练速度更快
- Time-dependent processing is based on LSTMs for local processing, and multi-head attention for integrating information from any time step.