【时间序列】Patch：到底是什么？

最新推荐文章于 2025-03-29 11:12:39 发布

TIM老师

最新推荐文章于 2025-03-29 11:12:39 发布

阅读量1.3k

点赞数 20

文章标签：时间序列深度学习

本文链接：https://blog.csdn.net/AuGuSt_81/article/details/146140955

版权

1. 从图像到时间序列的隐喻

在计算机视觉领域，“Patch”指图像中被切割的小块区域（例如将一张图片划分为16×16像素的局部片段）。Transformer模型（如ViT）通过分析这些Patch间的全局关系，成功捕捉了图像的语义信息。这种分块思想启发了时序领域的研究者——能否将连续的时间序列拆解为局部片段（Patch），并通过学习片段间的模式实现更高效的预测？

2. 传统时序建模的瓶颈

传统方法如滑动窗口（Sliding Window）或递归神经网络（RNN）存在明显局限：

滑动窗口：固定窗口大小难以捕捉多尺度特征，且相邻窗口重叠导致冗余计算。
RNN/CNN：RNN的序列依赖性限制了并行性，CNN的局部感受野难以建模长期依赖。

3. Patch的核心定义与划分策略

在时间序列中，一个Patch是一段连续的时间片段，其划分包含两个关键参数：

长度（Patch Length）：决定局部模式的粒度。例如，每小时温度数据中，一个Patch可能覆盖6小时。
步长（Stride）：控制相邻Patch的重叠程度。非重叠（Stride=Length）降低冗余，重叠（Stride<Length）增强局部连续性。

示例：对长度为120的序列，若Patch Length=24、Stride=12，则得到9个重叠的Patch（覆盖范围：1-24, 13-36, …, 97-120）。

4. Patch的数学表达与特征提取

每个Patch可视为原始时序的局部投影：
$P_i = \mathbf{W} \cdot X_{t:t+L-1} + \mathbf{b}$
其中， $X_{t:t+L-1}$ 为原始序列段， $\mathbf{W}$ 和 $\mathbf{b}$ 为可学习的线性投影参数。通过堆叠多层Transformer，模型能够：