现代循环神经网络:深度循环神经网络

专栏:神经网络复现目录

深度循环神经网络

深度循环神经网络(Deep Recurrent Neural Network,简称DRNN)是一种循环神经网络(Recurrent Neural Network,简称RNN)的扩展形式,它具有多个隐藏层,并且可以处理长度不固定的序列数据。与传统的RNN相比,DRNN在每个时间步上执行多次非线性转换,以便对更长的序列数据进行建模。

在DRNN中,每个时间步的输入和隐藏状态都是向量形式的。网络中的每个隐藏层都有自己的权重矩阵,并且这些权重矩阵可以共同对输入和前一个隐藏层的状态进行转换。这使得DRNN能够通过多次非线性变换来学习更高级别的特征,从而提高其在序列数据上的建模能力。

DRNN可以应用于多种领域,如语音识别、自然语言处理、图像处理等。例如,在自然语言处理领域,DRNN可以用于处理不定长的文本序列,并进行情感分析、语音识别和机器翻译等任务。
在这里插入图片描述



数学计算

深度循环神经网络(DRNN)的计算公式可以描述为以下步骤:

对于每个时间步 t t t,输入 x t x_t xt 和前一个时间步的隐藏状态 h t − 1 h_{t-1} ht1,计算当前时间步的隐藏状态 h t h_t ht
h t = f ( W x t + U h t − 1 + b ) h_t = f(Wx_t + Uh_{t-1} + b) ht=f(Wxt+Uht1+b)

其中, W W W 是输入 x t x_t xt 的权重矩阵, U U U 是前一个时间步的隐藏状态 h t − 1 h_{t-1} ht1 的权重矩阵, b b b 是偏置项。 f f f 是非线性激活函数,如sigmoid、tanh或ReLU等。

对于深度循环神经网络,可以使用多个隐藏层来提高网络的表达能力。每个隐藏层的计算方式与第一个隐藏层相同,但输入为前一个隐藏层的输出 h t − 1 ( l ) h_{t-1}^{(l)} ht1(l)
h t ( l ) = f ( W ( l ) h t ( l − 1 ) + U ( l ) h t − 1 ( l ) + b ( l ) ) h_t^{(l)} = f(W^{(l)}h_t^{(l-1)} + U^{(l)}h_{t-1}^{(l)} + b^{(l)}) ht(l)=f(W(l)ht(l1)+U(l)ht1(l)+b(l))

其中, W ( l ) W^{(l)} W(l) U ( l ) U^{(l)} U(l) 分别是第 l l l 个隐藏层的权重矩阵, b ( l ) b^{(l)} b(l) 是第 l l l 个隐藏层的偏置项。

输出层的计算方式与传统的神经网络相同,即将最后一个隐藏层的输出 h T ( L − 1 ) h_T^{(L-1)} hT(L1) 通过一个全连接层进行线性变换,并经过一个激活函数 g g g(如softmax):
y = g ( V h T ( L − 1 ) + c ) y = g(Vh_T^{(L-1)} + c) y=g(VhT(L1)+c)

其中, V V V 是输出层的权重矩阵, c c c 是输出层的偏置项。

整个深度循环神经网络的训练过程就是通过反向传播算法来计算损失函数关于权重和偏置项的梯度,并使用梯度下降等优化算法来更新参数。

实现

import torch
from torch import nn
from d2l import torch as d2l

batch_size, num_steps = 32, 35
train_iter, vocab = d2l.load_data_time_machine(batch_size, num_steps)
vocab_size, num_hiddens, num_layers = len(vocab), 256, 2
num_inputs = vocab_size
device = d2l.try_gpu()
lstm_layer = nn.LSTM(num_inputs, num_hiddens, num_layers)
model = d2l.RNNModel(lstm_layer, len(vocab))
model = model.to(device)

注意:num_layers参数即为隐藏层层数

num_epochs, lr = 500, 2
d2l.train_ch8(model, train_iter, vocab, lr*1.0, num_epochs, device)

在这里插入图片描述

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

青云遮夜雨

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值