1. what is motivation?研究动机
在近年来,时间序列预测出现新局面:海量(上千甚至是上百万)相关时间序列的预测。例如,预测城市中每户居民的用电量,大型零售商所有商品的销量等。在上述所有场景中,可以使用那些过去相似、或相关的时间序列来对单个时间序列进行建模预测。 这样做的优势是:可以拟合复杂模型而不产生过拟合,免去传统机器学习中所必须的大量人工特征制作的过程。
2. What is the problem the paper wants to solve?论文想要解决的问题是什么?
海量(上千甚至是上百万)相关时间序列的预测。具体的问题有:
- 海量时间序列的数量级不同,而且数量级的分布严重偏斜
- 很难按照数量级的不同分组训练模型,因为无法保证这样分组情况下,组内的序列具有相同的偏度。
- 标准化、批量归一化和正则化的手段都将失效
3. What is their approach?论文提出的方法?
数学语言描述:
在第 t t t时刻,对于给定的第 i i i个时间序列的值记为 z i , t z_{i,t} zi,t, 我们的目标是建立如下条件概率分布模型:
P ( z i , t 0 : T ∣ z i , 1 : t 0 − 1 , x i , 1 : T ) P(\bold{z}_{i, t_0:T}|\bold{z}_{i, 1:t_0-1}, \bold{x}_{i, 1:T}) P(zi,t0:T∣zi,1:t0−1,xi,1:T)
其中:
- z i , t 0 : T = [ z i , t 0 , z i , t 0 + 1 , . . , z i , T ] \bold{z}_{i, t_0:T} = [{z}_{i, t_0}, {z}_{i, t_0+1}, .., {z}_{i, T}] zi,t0:T=[zi,t0,zi,t0+1,..,zi,T] 表示未来要预测的时间序列。而 [ t 0 , T ] [t_0, T] [t0,T]表示模型的预测范围。
- z i , 1 : t 0 −