Pytorch LSTM初识(详解LSTM+torch.nn.LSTM()实现)1

最新推荐文章于 2024-07-13 13:25:22 发布

csdn_1HAO

最新推荐文章于 2024-07-13 13:25:22 发布

阅读量1.5k

点赞数 1

分类专栏： Pytorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/caomin1hao/article/details/106795002

版权

本文深入介绍了LSTM的工作原理，包括遗忘门、输入门、细胞状态更新和输出门。接着，详细讨论了PyTorch中LSTM的实现，包括参数设置、计算公式，并给出了两个实例。此外，还解释了LSTM模型的输入输出结构。

摘要由CSDN通过智能技术生成

pytorch LSTM1初识

目录

pytorch LSTM1初识

一、LSTM简介1

1.1 遗忘门，

1.2 确定什么样的新信息被存放在当前Cell中（也即中）。

1.3 确定更新Cell中的信息

1.4 输出(这里ht既是实际输出，也是下一层的隐藏层输入，具体如图所示)

二、LSTM简介2

三、pytorch实现

3.2 定义好LSTM ()后参数，这里不明白，可先看下面实例，再回头看此项：

3.3 计算公式

3.4 LSTM实例1：

3.5 LSTM实例2：

3.6 Pytorch中LSTM模型图：

一、LSTM简介1

LSTM整体图：

1.1 遗忘门，

决定是否丢弃或丢弃多少Cell中所存的之前的信息（也即Ct-1中）。sigmoid输出0到1之间的数字，数值的大小操作决定多少信息可以传送过去；当为0时，不传送；当为1时，全部传送。

计算公式：

1.2 确定什么样的新信息被存放在当前Cell中（也即 $C_{t}$ 中）。

首先，sigmoid 层称 “输入门层” 决定什么值我们将要更新。然后， tanh 层创建一个新的候选值向量 $\tilde{C_{t}}$ ， $\tilde{C_{t}}$ 会被加入到状态中。

sigmoid 层计算公式

tanh 层计算公式

1.3 确定更新Cell中的信息

计算公式

符号： $\odot$ ，是Hadamard Product，也就是操作矩阵中对应的元素相乘，因此要求两个相乘矩阵是同型的。

1.4 输出(这里ht既是实际输出 $y_{t}$ ，也是下一层的隐藏层输入 $h_{t}$ ，具体如图所示)

首先， sigmoid 层来确定Cell状态的哪个部分将输出出去；然后，把C

最低0.47元/天解锁文章

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。