时间序列学习（6）——LSTM中Layer的使用

最新推荐文章于 2023-07-03 16:28:58 发布

山外小楼听夜雨.

最新推荐文章于 2023-07-03 16:28:58 发布

阅读量2.4k

点赞数 1

分类专栏：循环神经网络文章标签： LSTM RNN 循环神经网络深度学习 pytorch

本文链接：https://blog.csdn.net/weixin_42521185/article/details/124572497

版权

循环神经网络专栏收录该内容

7 篇文章 3 订阅

订阅专栏

文章目录

1 复习一下 nn.RNN 的参数
2 LSTM的 __init__函数
3 LSTM.forward()
4 动手写一个简单的lstm层

1 复习一下 nn.RNN 的参数

参数介绍：

（1）input_size ： The number of expected features in the input x （x的特征维数，比如说如果是一个单词用100d的向量来表示的话，那么input_size=100）
（2）hidden_size ： The number of features in the hidden state h （表示隐藏层的特征维数，这个是自己指定的，而且是通过不断迭代来确定hidden_size 的取值的）
（3）num_layers: Number of recurrent layers. 例如., setting num_layers=2 （就是说 RNN 的层数）【默认为1】
（4）bias ：表示是否需要偏置量 bias weights b_ih and b_hh. 【默认是True】
（5）batch_first ：如果是batch_first，则输入数据维度：(batch, seq, feature)；否则为 (seq, batch, feature)【默认为False】
（6）dropout ：随机丢失一部分神经元。【默认为0，就是全保留全部神经元】
（7）bidirectional ：是否是双向的RNN。【默认是False】

2 LSTM的 init函数

为什么要复习一下RNN 呢，就是因为这里LSTM的参数基本上和RNN是一样的，加了一个（8）

3 LSTM.forward()

需要注意的是，传入的x的shape，而且这次要传入初始 $ht_1，ct_1$
输出是两个，一个是out，还有一个是中间的memory，(ht, ct)

out, (ht, ct) = lstm(x, [ht_1, ct_1])

x : [ seq, batch, word_vec] （这边batch_first=0），和RNN 是一样的
h和c ：[num_layer, batch, hidden_feature]
out ： [seq, batch, hidden_feature]

4 动手写一个简单的lstm层

代码如下：

import torch
from torch import nn

lstm = nn.LSTM(input_size=100, hidden_size=20, num_layers=4)
print(lstm)
x = torch.randn(10, 3, 100)  # [seq, b, word_vec]
out, (h, c) = lstm(x)
print(out.shape, h.shape, c.shape)

输出如下：

LSTM(100, 20, num_layers=4)
torch.Size([10, 3, 20]) torch.Size([4, 3, 20]) torch.Size([4, 3, 20])

山外小楼听夜雨.

关注

1
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
时间序列学习（6）——LSTM中Layer的使用

文章目录1 复习一下 nn.RNN 的参数1 复习一下 nn.RNN 的参数最常用的几个参数：（1）input_size ： The number of expected features in the input x （x的特征维数，比如说如果是一个单词用100d的向量来表示的话，那么input_size=100）（2）hidden_size ： The number of features in the hidden state h （表示隐藏层的特征维数，这个是自己指定的，而且是通过不断迭
复制链接

扫一扫