Triformer有三个创新点,
(1)使用Patch Attention 将原始的 attention的计算替换掉作为一个基本块。
(2)提出了一个三角收缩模块,在堆叠层数的时候。也就是类似于pooling?也就是说本文提出了一种新的池化方式替换掉informer里面作者使用的传统的池化方式。
(3)提出了一种轻量级别的变量specific建模方式,使得能够抓住不同变量之间的时间特性。
Triformer有三个创新点,
(1)使用Patch Attention 将原始的 attention的计算替换掉作为一个基本块。
(2)提出了一个三角收缩模块,在堆叠层数的时候。也就是类似于pooling?也就是说本文提出了一种新的池化方式替换掉informer里面作者使用的传统的池化方式。
(3)提出了一种轻量级别的变量specific建模方式,使得能够抓住不同变量之间的时间特性。