informer之解码器的输入过程详细解释

最新推荐文章于 2024-07-19 23:38:36 发布

six.学长

最新推荐文章于 2024-07-19 23:38:36 发布

阅读量572

点赞数 6

分类专栏： informer详细流程 informer 文章标签：深度学习神经网络 cnn

本文链接：https://blog.csdn.net/m0_51200050/article/details/139796605

版权

39 篇文章 0 订阅

订阅专栏

5 篇文章 0 订阅

订阅专栏

解码器的输入过程与编码器有一些相似之处，但也有其特定的特点和处理步骤。以下是详细的解码器输入过程的解释：

首先，解码器接收来自编码器的输出特征，通常这些特征已经过卷积、注意力机制和蒸馏等处理，具有较高的特征表示能力。解码器的任务是将这些高层次的特征转换为目标输出。

作用：与编码器的1x3卷积层相似，主要用于进一步提取和压缩特征。
具体过程：
- 使用1x3的卷积核对输入特征进行卷积操作。
- 这一操作考虑当前时间点及其前后各一个时间点的数据，生成新的特征表示。
- 输出特征维度保持不变，但特征表示更加精炼。
公式：
$\text{Conv1d}(x) = \sum_{i=-1}^{1} w_i \cdot x_{t+i}$
其中， $x$ 是输入特征， $w$ 是卷积核权重， $t$ 是时间步。

数据预处理：
- 解码器输入通常是从编码器输出的特征序列，假设其长度为N，特征维度为512。
1x3 Conv1d 层处理：
- 将输入特征通过1x3的卷积核进行卷积操作，生成新的特征表示。
- 例如，对于时间点t，卷积操作考虑了 $t - 1, t, t + 1$ 三个时间点的数据，产生一个新的特征值。
嵌入层处理：
- 将卷积后的特征表示转换为高维向量。每个时间点的特征被映射到一个512维的向量空间。
- 这一步使用了嵌入矩阵，将每个时间点的特征表示映射为一个高维度的嵌入向量。

假设输入数据是一个长度为10的时间序列数据，表示从编码器输出的特征序列：

$v_1, v_2, v_3, v_4, v_5, v_6, v_7, v_8, v_9, v_{10}]$

1x3 Conv1d 层处理：
- 输入特征维度： $10, 512$ 。
- 使用1x3的卷积核对每个时间点及其前后各一个时间点进行卷积操作。
- 输出特征维度： $10, 512$ 。
嵌入层处理：
- 将卷积后的每个特征值映射到一个512维的向量。
- 例如，假设卷积后的一组特征值为： $v'_1, v'_2, v'_3, v'_4, v'_5, v'_6, v'_7, v'_8, v'_9, v'_{10}]$ ，那么每个值将通过嵌入矩阵映射为一个512维向量。

通过1x3 Conv1d层和嵌入层，解码器的输入特征被进一步提取和转换为高维度的向量表示，这些表示更适合后续的注意力机制和解码器中的处理步骤。这个过程通过局部卷积和高维嵌入来增强输入特征的表示能力，从而使模型能够更好地捕捉和利用序列中的模式和依赖关系。

接下来，我们将详细解释解码器中的掩码稀疏注意力块（Masked ProbSparse Block）以及其具体实现步骤和功能。

关注