一个链接写的挺好
PatchTST = Patch + Transformer
1.通道独立性

2.Patching
模型可以通过观察一组时间步骤而不是单个时间步骤来提取局部语义含义
大大减少了馈送到Transformer编码器的标记数量。在这里,每个patch都变成了输入到Transformer的一个token。这样,我们可以将token的数量从L减少到大约L/S

文章探讨了PatchTST方法,它通过将时间序列分割成独立的patch,让Transformer以更高效的方式处理,减少了输入token数量,从而改进了时间序列预测性能。这种方法强调了通道独立性和Patching在Transformer编码器中的作用。
一个链接写的挺好
PatchTST = Patch + Transformer
1.通道独立性

2.Patching
模型可以通过观察一组时间步骤而不是单个时间步骤来提取局部语义含义
大大减少了馈送到Transformer编码器的标记数量。在这里,每个patch都变成了输入到Transformer的一个token。这样,我们可以将token的数量从L减少到大约L/S

1883
2684

被折叠的 条评论
为什么被折叠?
>