Task03 循环神经网络进阶（pytorch代码实现）

最新推荐文章于 2024-05-04 19:43:38 发布

l_yiyu

最新推荐文章于 2024-05-04 19:43:38 发布

阅读量556

点赞数

分类专栏：动手学深度学习

本文链接：https://blog.csdn.net/l_yiyu/article/details/104370779

版权

循环神经网络进阶

⻔控循环神经⽹络（GRU）

当时间步数较⼤或者时间步较小时，循环神经⽹络的梯度较容易出现衰减或爆炸。虽然裁剪梯度可以应对梯度爆炸，但⽆法解决梯度衰减的问题。通常由于这个原因，循环神经⽹络在实际中较难捕捉时间序列中时间步距离较⼤的依赖关系。

⻔控循环神经⽹络（GRU）：捕捉时间序列中时间步距离较⼤的依赖关系

CNN：
循环神经网络 CNN

GRU：
门控循环单元GRU
• 重置⻔有助于捕捉时间序列⾥短期的依赖关系；
• 更新⻔有助于捕捉时间序列⾥⻓期的依赖关系。

GRU pytorch简洁代码实现

import numpy as np
import torch
from torch import nn, optim
import torch.nn.functional as F
import sys
sys.path.append(".")
import d2lzh_pytorch as d2l
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

(corpus_indices, char_to_idx, idx_to_char, vocab_size) = d2l.load_data_jay_lyrics()

num_hiddens=256
num_epochs, num_steps, batch_size, lr, clipping_theta = 160, 35, 32, 1e2, 1e-2
pred_period, pred_len, prefixes = 40, 50, ['分开', '不分开']

lr = 1e-2 # 注意调整学习率
gru_layer = nn.GRU(input_size&#

最低0.47元/天解锁文章

l_yiyu

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Task03 循环神经网络进阶（pytorch代码实现）

循环神经网络进阶⻔控循环神经⽹络（GRU）当时间步数较⼤或者时间步较小时，循环神经⽹络的梯度较容易出现衰减或爆炸。虽然裁剪梯度可以应对梯度爆炸，但⽆法解决梯度衰减的问题。通常由于这个原因，循环神经⽹络在实际中较难捕捉时间序列中时间步距离较⼤的依赖关系。⻔控循环神经⽹络（GRU）：捕捉时间序列中时间步距离较⼤的依赖关系CNN：GRU：• 重置⻔有助于捕捉时间序列⾥短期的依赖关系；...
复制链接

扫一扫