编码器输入的详细过程(文章最后有位置编码加入)

编码器输入的详细过程

1. 输入数据的处理

首先,输入数据是一个时间序列数据。例如,假设我们要处理的是每日销售量的数据,输入数据可以表示为一个包含时间和销售量的序列。

2. 1x3 Conv1d 层
  • 作用:1x3的Conv1d层是一个一维卷积层,窗口大小为3,这意味着每次卷积操作考虑当前时间点及其前后各一个时间点的数值。
  • 目的:捕捉输入数据的局部时间依赖关系。
  • 输出:通过卷积操作,原始时间序列数据被转换为新的特征表示,这些特征包含了输入数据的局部模式信息。
3. 嵌入层(Embedding Layer)
  • 作用:嵌入层将输入数据转换为高维向量表示。
  • 维度:编码维度为 d = 512 d = 512 d=512,这意味着每个时间点的数据被转换为512维的向量。
  • 目的:增加数据的表达能力,使其更适合后续的注意力机制和深度学习模型处理。

具体步骤

  1. 数据预处理

    • 读取时间序列数据,假设有N个时间点,每个时间点的数据维度为1(如每日销售量)。
  2. 1x3 Conv1d 层处理

    • 将时间序列数据通过1x3的卷积核进行卷积操作,生成新的特征表示。
    • 例如,对于时间点t,卷积操作考虑了 t − 1 , t , t + 1 t-1, t, t+1 t1,t,t+1三个时间点的数据,产生一个新的特征值。
  3. 嵌入层处理

    • 将卷积后的特征表示转换为高维向量。每个时间点的特征被映射到一个512维的向量空间。
    • 这一步使用了嵌入矩阵,将每个时间点的特征表示映射为一个高维度的嵌入向量。

具体实例

假设输入数据是一个长度为10的时间序列数据,表示过去10天的销售量:

[ 50 , 55 , 60 , 65 , 70 , 75 , 80 , 85 , 90 , 95 ] [50, 55, 60, 65, 70, 75, 80, 85, 90, 95] [50,55,60,65,70,75,80,85,90,95]

  1. 1x3 Conv1d 层处理

    • 第一个时间点的数据不能完整卷积,所以前几个时间点的卷积结果会有所填充。
    • 例如,第一个有效卷积操作为: Conv ( 50 , 55 , 60 ) \text{Conv}(50, 55, 60) Conv(50,55,60),产生一个新的特征值。这个过程会持续到整个序列都卷积完。
  2. 嵌入层处理

    • 将卷积后的每个特征值映射到一个512维的向量。
    • 例如,假设卷积后的一组特征值为: [ 20 , 25 , 30 , 35 , 40 , 45 , 50 , 55 , 60 , 65 ] [20, 25, 30, 35, 40, 45, 50, 55, 60, 65] [20,25,30,35,40,45,50,55,60,65],那么每个值将通过嵌入矩阵映射为一个512维向量。

详细版

从你提供的图中可以看到,Informer模型的处理流程如下:

处理流程

  1. 原始输入

    • 输入序列 T = t + D x T = t + D_x T=t+Dx,包含Scalar(实际数值)和Stamp(时间戳)。
  2. 卷积层(Conv1d)

    • Scalar和Stamp分别经过1x3卷积层处理,生成卷积后的表示。这一步用来提取局部特征。
    • 图中,Scalar和Stamp分别经过两个单独的1x3卷积层,形成两个不同的卷积表示。
  3. 嵌入层(Embedding)

    • 卷积后的Scalar和Stamp表示分别经过嵌入层处理,转换为高维嵌入表示。
    • 图中展示了两个嵌入操作,分别将卷积后的Scalar和Stamp表示转换为高维表示 ( d )。
  4. 加和操作

    • 卷积和嵌入后的Scalar和Stamp表示在加号处相加,形成一个结合了数值信息和时间戳信息的表示。
  5. 位置编码(Positional Encoding)

    • 最后,加入位置编码,以确保模型能够捕捉输入序列的相对位置关系。
    • 图中没有明确显示位置编码的加法,但通常位置编码会在此步骤之后加入。

流程总结

  1. Scalar和Stamp输入:原始时间序列数据,包含数值和时间戳信息。
  2. 卷积处理:Scalar和Stamp分别通过1x3卷积层,提取局部特征。
  3. 嵌入转换:卷积后的表示分别经过嵌入层,转换为高维嵌入表示。
  4. 加和操作:卷积和嵌入后的Scalar和Stamp表示相加,形成结合后的表示。
  5. 位置编码:最后加入位置编码,确保模型能够理解序列中的位置关系。

实例说明

假设我们有如下时间序列数据:

日期温度 (°C)湿度 (%)一年中的第几天
2023-06-012560152
2023-06-022665153
2023-06-032458154
  • Scalar:

    • 温度(25, 26, 24)
    • 湿度(60, 65, 58)
  • Stamp:

    • 一年中的第几天(152, 153, 154)

处理步骤

  1. 卷积操作

    • 对温度和湿度(Scalar)进行1x3卷积,生成卷积特征。
    • 对时间戳(Stamp)进行1x3卷积,生成时间特征。
  2. 嵌入层

    • 将卷积后的温度和湿度表示嵌入到高维空间。
    • 将卷积后的时间戳表示嵌入到高维空间。
  3. 加和操作

    • 将嵌入后的Scalar和Stamp表示相加,得到综合特征表示。
  4. 位置编码

    • 最后,将位置编码加入到综合特征表示中,以引入序列的位置信息。

通过上述步骤,Informer模型能够更好地理解和处理时间序列数据,充分利用数值和时间信息来进行预测。

小结

通过1x3 Conv1d层和嵌入层,输入的原始时间序列数据被转换成高维度的特征表示,这些表示更适合后续的注意力机制和编码器中的处理步骤。这个过程通过局部卷积和高维嵌入来增强输入数据的特征表示能力,从而使模型能够更好地捕捉和利用时间序列中的模式和依赖关系。

  • 27
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值