基于双阶段注意力机制和 Bi-LSTM 的多变量时间序列预测网络用户情感变化趋势

最新推荐文章于 2024-11-19 14:23:05 发布

小小胖胖龙

最新推荐文章于 2024-11-19 14:23:05 发布

阅读量723

点赞数 10

文章标签： lstm 人工智能 rnn

本文链接：https://blog.csdn.net/weixin_55054241/article/details/139281560

版权

双阶段注意力机制：输入注意力机制和时间注意力机制，引入注意力机制就可以对于不同的特征赋予不同的权重，便于预测用户的情感趋势。

RNN循环神经网络：RNN循环神经网络具有短期记忆功能，RNN 网络由输入层、隐藏层和输入层三部分组成，且隐藏层同时与自身和输出层相连，RNN 网络当前时刻隐藏层的值与当前时刻的输入共同作为其下一时刻的输入。

RNN 网络虽然可以对一定长度输入的序列进行建模预测，但是当序列过长时，预测性能较差。

LSTM网络：而 LSTM 网络巧妙地在 RNN 网络的基础上引入了门控机制（Gating Mechanism）[72]，三个“门”分别为：输入门（input gate）、遗忘门（forget gate）和输出门（output gate）。此外，LSTM 网络还在神经元中新增了一个新的记忆单元状态，它负责把信息从序列初始的位置传递到序列末尾位置，完成信息的循环传递，同时向隐藏层传递信息，用于存储序列的长时间特性，LSTM 网络有效地捕捉了时间序列的长期依赖性，因此适合用于时间序列预测领域。

通过输入门、遗忘门和输出门来改变记忆单元的状态。根据遗忘门和输入门的输出结果更新记忆单元的状态，这一步骤保存了数据的长期特征，避免了因无关特征增加的模型的计算复杂度，输出门（ output gate ）：负责控制输出当前记忆单元状态的哪些信息。

所以已经有学者提出基于 DA-RNN 的多变量时间序列预测，但是在大数据时代背景下，人们收集到的时间序列数据恰恰大都是多变量的，因此这些输入之间会有或多或少的相互作用，而 DA-RNN 模型的编码器只用了单向的 LSTM 网络对输入序列进行特征提取，提取到的特征并不充分。

在此基础上提出基于双阶段注意力机制和 Bi-LSTM 的多变量时间序列预测：

Bi-LSTM：Bi-LSTM网络在上下文信息建模时具备更强的长期记忆能力。因此，Bi-LSTM 网络比 LSTM 网络更适合研究时间序列数据。Bi-LSTM 网络不是简单地加深网络深度，而是能够根据两个方向的特征进行预测，通过一个前向 LSTM 和一个后向 LSTM 得到两个序列相反的隐含层状态，分别获取了输入特征的历史信息和未来信息，捕捉了序列数据两个时间方向的特征。使提取的特征将更加精准。

基于双阶段注意力机制和 Bi-LSTM 的多变量时间序列预测模型主要分为两个阶段，编码器和解码器：

在编码器阶段，首先利用输入注意力机制将当前时刻影响力大的输入序列赋予较大的权重，影响力小的输入序列赋予较小权重，从而有效削弱不相关信息的干扰；再利用 Bi-LSTM 网络进行编码，提取输入序列的特征，即当前时刻 Bi-LSTM（双向长短期记忆网络）网络的隐藏状态。在解码器阶段，将 Encoder 阶段当前时刻、历史时刻的网络隐藏状态（特征）结合，并利用注意力机制，赋予当前、历史时刻的隐藏状态不同的权重，得到更加优化的特征输出；再利用 LSTM 网络进行解码，得到最终预测结果。