Pytorch深度学习实践第十二讲 RNN 课后2（GRU）

最新推荐文章于 2024-05-07 21:02:09 发布

改什么都是已存在？

最新推荐文章于 2024-05-07 21:02:09 发布

阅读量638

点赞数 1

分类专栏： Pytorch深度学习实践文章标签：深度学习神经网络 rnn pytorch

本文链接：https://blog.csdn.net/weixin_46047643/article/details/115365987

版权

本文介绍了使用Pytorch实现GRU网络处理循环神经网络任务，通过GRU模型训练‘hello’到‘ohlol’的转换，并探讨了加入embedding层对模型效果的改进。详细阐述了GRU的网络结构和计算过程，展示了加入embedding后的代码及输出结果。

摘要由CSDN通过智能技术生成

B站刘二大人传送门循环神经网络（基础篇）

课件链接：https://pan.baidu.com/s/1vZ27gKp8Pl-qICn_p2PaSw
提取码：cxe4

模型还是将输入“hello”训练输出为“ohlol”，用GRU网络实现。按照计算图实现GRU之后，像前面一样又尝试了加入embedding的方法，效果略有改进。
在这里插入图片描述
GRU的网络结构示意图和公式：

下面的公式和上面一样，就是写法不同。

首先看公式有6个线性层，之后又进行了非线性运算，所以模型定义了6个linear。输入是4维向量（h、e、l、o），不打算改变维度，所以输出也都是4维。只有5个输入，所以批量设为1.向前传播根据计算公式和计算图，返回hidden继续在下一轮计算继续用。和上一篇LSTM大同小异，只有网络结构和网络输出上有点不一样。

import torch

input_size = 4
batch_size = 1
class GRU(torch.nn.Module):
    def __init__(self):
        super(GRU, self).__init__()
        self.linearrx = torch.nn.Linear(4, 4)
        self.linearzx = torch.nn.Linear(4, 4)
        self.linearnx = torch.nn.Linear(4, 4)
        self.linearrh = torch.nn.Linear(4, 4)
        self.linearzh = torch.nn.Linear(4, 4)
        self.linearnh = torch.nn.Linear(4, 4)
        self.sigmoid = torch.nn.Sigmoid()
        self.tanh = torch.nn.Tanh()

    def forward(self, x, hidden):
        r = self.sigmoid(self.linearrx(x) + self.linearrh(hidden))
        z = self.sigmoid(self.linearzx(x) + self.linearzh(hidden))
        n = self.tanh(self.linearnx(x) + r * self.linearnh(hidden)

最低0.47元/天解锁文章

改什么都是已存在？

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
2
评论
Pytorch深度学习实践第十二讲 RNN 课后2（GRU）

B站刘二大人传送门循环神经网络（基础篇）课件链接：https://pan.baidu.com/s/1vZ27gKp8Pl-qICn_p2PaSw提取码：cxe4模型还是将输入“hello”训练输出为“ohlol”，用GRU网络实现。按照计算图实现GRU之后，像前面一样又尝试了加入embedding的方法，效果略有改进。GRU的网络结构示意图和公式：下面的公式和上面一样，就是写法不同。首先看公式有6个线性层，之后又进行了非线性运算，所以模型定义了6个linear。输入是4维向量（h、
复制链接

扫一扫

专栏目录