在decode阶段,训练结果的维度通常由trainingHelper中的sequence_length指定。
training_logits的shape为batch_size*target_sequence_length*decoder_embeding_size,
其中第二维度是每批target数据的固定长度,
embeding_size是转换后的解码层维度,
即decoder_embed_input向量的列维
with tf.variable_scope("decode"):
# 得到help对象
training_helper = tf.contrib.seq2seq.TrainingHelper(inputs=decoder_embed_input,