RNN中的pack_padded_sequence和pad_packed_sequence函数用法 详解二 LSTM的一次forward对应一个time step,接收的是across batches的输入,这就导致短序列可能在当前time step上已经结束,而你还是在给它输入东西(pad),这就会对结果产生影响(可以对照公式看看,即便输入全0还是会有影响)。我们想要的效果是,LSTM知道batch中每个序列的长度,等到某个序列输入结束后下面的time step就不带它了。