您可以使用描述中的bucketing和padding的想法
创建RNN网络的rnn函数也接受参数sequence_length .
例如,您可以创建相同大小的数据桶,用必要数量的零填充它们,或者代表零字的placeholdres,然后将它们与seq_length = len(zero_words)一起提供 .
seq_length = tf.placeholder(tf.int32)
outputs, states = rnn.rnn(cell, inputs,initial_state=initial_state,sequence_length=seq_length)
sess = tf.Session()
feed = {
seq_lenght: 20,
#other feeds
}
sess.run(outputs, feed_dict=feed)
在这里,最重要的是,如果你想利用一个句子获得的状态作为下一个句子的状态,当你提供sequence_length时,(假设20和填充后的句子是50) . 你想要在第20步获得的状态 . 为此,做
tf.pack(states)
那个电话之后
for i in range(len(sentences)):
state_mat = session.run([states],{
m.input_data: x,m.targets: y,m.initial_state: state, m.early_stop:early_stop })
state = state_mat[early_stop-1,:,:]