这个隐藏状态其实就是对于每个时间步,结合之前的长期记忆后得到的一个抽象特征。它跟普通RNN的不同之处就在于这个抽象特征。RNN抽象出来的这个特征,因为没有C,所以不能保存长期记忆,所以效果不好,LSTM因为有C,所以会考虑得更多。
nn.LSTM中的hidden_size指的是每个时间步输出的h的长度。
这个隐藏状态其实就是对于每个时间步,结合之前的长期记忆后得到的一个抽象特征。它跟普通RNN的不同之处就在于这个抽象特征。RNN抽象出来的这个特征,因为没有C,所以不能保存长期记忆,所以效果不好,LSTM因为有C,所以会考虑得更多。
nn.LSTM中的hidden_size指的是每个时间步输出的h的长度。