一个链接写的挺好
PatchTST = Patch + Transformer
1.通道独立性
2.Patching
模型可以通过观察一组时间步骤而不是单个时间步骤来提取局部语义含义
大大减少了馈送到Transformer编码器的标记数量。在这里,每个patch都变成了输入到Transformer的一个token。这样,我们可以将token的数量从L减少到大约L/S
一个链接写的挺好
PatchTST = Patch + Transformer
1.通道独立性
2.Patching
模型可以通过观察一组时间步骤而不是单个时间步骤来提取局部语义含义
大大减少了馈送到Transformer编码器的标记数量。在这里,每个patch都变成了输入到Transformer的一个token。这样,我们可以将token的数量从L减少到大约L/S