Multi-task Learning Method for Hierarchical Time Series Forecasting


Yang M , Hu Q , Wang Y . Multi-task Learning Method for Hierarchical Time Series Forecasting[M]// Artificial Neural Networks and Machine Learning – ICANN 2019: Text and Time Series. 2019.

这篇文章基于多任务学习,提出了一种新的集成层次预测的模型

首先解释一下什么是层次时间序列
在这里插入图片描述
下图更为直观:
在这里插入图片描述

motivation

在这里插入图片描述
一般而言,层次时间序列预测的实现方法是“两步方法”:首先独立预测所有的时间序列,然后对结果进行协调,满足聚合一致性。这种方法的问题:1.高的计算复杂度(因为对每一个单独预测的时间序列都需要去进行拟合),2.无法确保所有时间序列取得最佳的预测结果。
利用多任务学习的优点,构建了一个集成模型:结合了底层序列的特征 and 层级结构。
该模型特点:1.同时输出所有时间序列的预测,并进行一致汇总;2.利用时间序列之间的相关性;3.通过全局损失函数,实现预测结果总体上最佳

主要贡献

在这里插入图片描述

  1. 基于多任务学习,提出了一种新型集成层次预测模型, 预测结果满足聚集一致性并且总体上是最佳的。
  2. 通过在模型的两部分上施加不同的正则化来学习稀疏模型。
  3. 在数值模拟和真实数据上进行实验,都取得了更好的整体性能。

形式定义

在这里插入图片描述
y t : n y_t:n ytn维行向量,t时刻所有观测到的时间序列, b t : m b_t:m btm维行向量,所有观测到的底层的时间序列, a t : l a_t:l atl维行向量,所有整合的时间序列。
可以得出关系如下:
在这里插入图片描述
根据图1的结构可以得到S如下:
在这里插入图片描述
通过这个矩阵相乘关系可以同时获得所有时间序列。

两个模型

MHFM(multi-task hierarchical forecasting model)

在这里插入图片描述

  1. 将底层的所有时间系列的特征提取到整个输入特征空间中;
  2. 将层次结构整合到模型中;
  3. 通过优化全局目标函数,实现同时预测所有的时间序列并实现整体预测最优。
    公式如下:
    i i i个时间序列的预测模型:
    在这里插入图片描述
    解析解:
    在这里插入图片描述

多任务分层预测模型:
在这里插入图片描述
目标函数:
在这里插入图片描述
求解W:
在这里插入图片描述

DMHFM(dirty multi-task hierarchical forecasting model)

随着层次中的时间序列数量的增加,很容易陷入维度爆炸,所以学习数据的基础结构(如:稀疏性、低秩结构等)有助于提高模型的准确性并使其更可靠,所以提出了DMHFM:
在这里插入图片描述

  1. 组稀疏性分量:
    采用 l 1 , ∞ − n o r m l_{1,\infty}-norm l1,norm正则化实现联合特征选择(P)
  2. 元素级稀疏性分量:
    采用 l 1 − n o r m l_1-norm l1norm正则化保持每个序列的唯一性(Q)

公式如下:在这里插入图片描述
组稀疏性分量: ∣ ∣ P ∣ ∣ 1 , ∞ = ∑ i ∣ ∣ P i ∣ ∣ ∞ = max ⁡ j ∣ P 0 , j ∣ + max ⁡ j ∣ P 1 , j ∣ + . . . + max ⁡ j ∣ P i , j ∣ ||P||_{1,\infty}=\sum_{i}||P_i||_\infty=\max_j|P_{0,j}|+\max_j|P_{1,j}|+...+\max_j|P_{i,j}| P1,=iPi=jmaxP0,j+jmaxP1,j+...+jmaxPi,j每一行元素中绝对值最大的和。
元素级稀疏性分量: ∣ ∣ Q ∣ ∣ 1 , 1 = ∑ i ∣ ∣ Q i ∣ ∣ 1 = ∣ Q 0 , 0 ∣ + ∣ Q 0 , 1 ∣ + . . . + ∣ Q 0 , j ∣ + . . . + + ∣ Q i , 1 ∣ + . . . + ∣ Q i , j ∣ ||Q||_{1,1}=\sum_{i}||Q_i||_1=|Q_{0,0}|+|Q_{0,1}|+...+|Q_{0,j}|+...++|Q_{i,1}|+...+|Q_{i,j}| Q1,1=iQi1=Q0,0+Q0,1+...+Q0,j+...++Qi,1+...+Qi,j所有元素的绝对值之和。

采用accelerated gradient methods(AGM)方法进行优化。

实验

评价指标:ARMSE
在这里插入图片描述
进行了两个实验:1.数值模拟,2.旅游预测实验
都证明了提出的方法的有效性。

更多细节大家可以阅读原文~
在这里插入图片描述

评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值