基于self-attention的GRU预测模型

黑科技小土豆

已于 2023-12-14 12:06:13 修改

阅读量790

点赞数

分类专栏：深度学习文章标签：深度学习人工智能机器学习

于 2023-03-10 22:57:02 首次发布

本文链接：https://blog.csdn.net/qq_41728700/article/details/129455680

版权

深度学习专栏收录该内容

35 篇文章 8 订阅

订阅专栏

基于self-attention的GRU预测模型

特色：1、单变量，多变量输入，自由切换

2、单步预测，多步预测，自动切换

3、基于Pytorch架构

4、多个评估指标（MAE,MSE,R2,MAPE等）

5、数据从excel文件中读取，更换简单

6、标准框架，数据分为训练集、验证集，测试集

全部完整的代码，保证可以运行的代码看这里。

http://t.csdnimg.cn/El450

！！！如果第一个链接打不开，请点击个人首页，查看我的个人介绍。

（搜索到的产品后，点头像，就能看到全部代码）

黑科技小土豆的博客_CSDN博客-深度学习,32单片机领域博主

1、GRU-selfAttention模型背景简介

GRU全名Gated Recurrent Units，是一种递归神经网络的变种。它改变了LSTM中的记忆单元和门的结构，只使用了两个门（重置门和更新门）并且直接传递当前状态到输出。

self-attention机制同样适用于GRU网络，可以根据输入序列自适应地计算各个时间步的权重。

因此，GRU-selfAttention模型采用GRU网络结合self-attention机制，来更好地解决序列数据中存在的长期依赖关系和局部依赖之间的复杂关系。

2、GRU-selfAttention模型优点总结

本模型的优点有：

GRU结构相对LSTM更加轻量级，计算速度更快，可以更快地进行训练和预测；
self-attention机制能够更好地处理序列数据之间的关系，为GRU网络提供各个时间步不同的辅助信息，帮助提高预测准确率。

train_ratio = 0.7  # 训练集比例
val_ratio = 0.15  # 验证集比例
test_ratio = 0.15  # 测试集比例
input_length = 48  # 输入数据长度，多步预测建议长，单步预测建议短
output_length = 1  # 输出数据长度，1为单步预测，1以上为多步预测 请注意，随着输出长度的增长，模型训练时间呈指数级增长
learning_rate = 0.1  # 学习率
estimators = 100  # 迭代次数
max_depth = 5  # 树模型的最大深度
interval_length = 2000  # 预测数据长度，最长不可以超过总数据条数
scalar = True  # 是否使用归一化
scalar_contain_labels = True  # 归一化过程是否包含目标值的历史数据
target_value = 'load'  # 需要预测的列名，可以在excel中查看