lstm里,多层之间传递的是输出ht ,同一层内传递的细胞状态(即隐层状态)
看pytorch官网对应的参数nn.lstm(*args,**kwargs),
默认传参就是官网文档的列出的列表传过去。对于后面有默认值(官网在参数解释第一句就有if啥的,一般传参就要带赋值号了。)
官网案例对应的就是前三个。input_size,hidden_size,num_layers
Parmerters:
input_size – The number of expected features in the input x.白话: 就是你输入x的向量大小(x向量里有多少个元素)
hidden_size – The number of features in the hidden state h 。白话:就是LSTM在运行时里面的维度。隐藏层状态的维数,即隐藏层节点的个数,这个和单层感知器的结构是类似的。这个维数值是自定义的,根据具体业务需要决定,如下图:
图中input_size:就是输入层,左边蓝色方格 [i0,i1,i2,i3,i4],hidden_size:就是隐藏层,中间黄色圆圈 [h0,h1,h2,h3,h4]。最右边蓝色圆圈 [o0,o1,o2] 的是输出层,