卷积神经网络(CNN)、循环神经网络(RNN)和自注意力(self-attention)对比

       考虑同一个的问题:将由n个词元组成的序列映射到另一个长度相同的序列,其中的每个输入词元或输出词元由d维向量表示。

        我们将比较能够解决上述问题的三种常用方法:卷积神经网络(CNN)、循环神经网络(RNN)和自注意力(self-attention),从三个维度比较这三种架构:计算复杂度、顺序操作和最大路径长度。

       其中,讨论顺序操作是因为顺序操作会妨碍并行计算。任意的序列位置组合之间的路径越短,越能更轻松地学习序列中的远距离依赖关系。

1、卷积神经网络(CNN)

考虑⼀个卷积核⼤⼩为k的卷积层。(后续文章中将介绍关于使⽤卷积神经⽹络处理序列的详细信息)⽬前只需要知道的是,由于序列⻓度是n,输⼊和输出的通道数量都是d,所以卷积层的计算复杂度为O\left ( knd^{2} \right )。 如图所⽰,卷积神经⽹络是分层的,因此为有O\left ( 1 \right )个顺序操作,最⼤路径⻓度为O\left ( n/k \right )。例如,\textup{\textbf{}x}_{1}\textup{\textbf{}x}_{5}处于图中卷积核⼤⼩为3的双层卷积神经⽹络的感受野内。

2、循环神经网络(RNN)

       当更新循环神经⽹络的隐状态时,d\times d权重矩阵和d维隐状态的乘法计算复杂度为O\left (d ^{2} \right )。由于序列⻓度为n, 因此循环神经⽹络层的计算复杂度为O\left (nd ^{2} \right )。根据图,有O\left (n \right )个顺序操作⽆法并⾏化,最⼤路径⻓度 也是O\left (n \right )

3、自注意力(self-attention)

        在⾃注意⼒中,查询、键和值都是n\times d矩阵。考虑缩放的”点-积“注意⼒,其中n\times d矩阵乘 以d\times n矩阵。之后输出的n\times n矩阵乘以n\times d矩阵。因此,⾃注意⼒具有O\left (n ^{2} d\right )计算复杂性。正如在图中所讲,每个词元都通过⾃注意⼒直接连接到任何其他词元。因此,有O\left ( 1 \right )个顺序操作可以并⾏计算,最⼤路径⻓度也是O\left ( 1 \right )

4、小结

总⽽⾔之,卷积神经⽹络和⾃注意⼒都拥有并⾏计算的优势,⽽且⾃注意⼒的最⼤路径⻓度最短,但是因为其计算复杂度是关于序列⻓度的⼆次⽅(⾃注意⼒具有O\left (n ^{2} d\right )计算复杂性),所以在很⻓的序列中计算会⾮常慢。

  • 11
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
基于卷积神经网络CNN)的时间序列预测是一种使用CNN模型来处理时间序列数据并进行预测的方法。相比于传统的基于循环神经网络RNN)的方法,CNN在处理时间序列数据时具有一些独特的优势。 以下是基于CNN的时间序列预测的基本步骤: 1. 数据准备:将时间序列数据集分为训练集和测试集。训练集用于训练CNN模型,测试集用于评估模型的预测性能。 2. 数据转换:由于CNN是基于图像处理的模型,需要将时间序列数据转换为二维图像数据。常用的方法有滑动窗口法和傅里叶变换法等。 3. CNN模型构建:构建一个包含卷积层、池化层和全连接层的CNN模型。卷积层用于提取时间序列数据中的特征,池化层用于降低特征维度,全连接层用于输出预测结果。 4. 模型训练:使用训练集对CNN模型进行训练。通过反向传播算法更新模型的权重和偏置,以最小化预测误差。 5. 模型预测:使用训练好的CNN模型对测试集进行预测。输入测试集的图像数据,通过前向传播算法得到预测结果。 6. 模型评估:使用预测结果与测试集的真实值进行比较,计算预测误差、均方根误差等指标,评估模型的预测性能。 需要注意的是,基于CNN的时间序列预测方法可以利用CNN对时间序列数据的局部特征进行提取,并具有良好的并行性和可解释性。然而,在实际应用中,需要根据问题的复杂性和数据的特点来选择合适的CNN模型结构和参数设置,以获得更好的预测效果。同时,还可以结合其他技术和方法,如自注意力机制self-attention)、残差网络(residual network)等,进一步提升预测性能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值