tensorflow 得到RNN的最后一个非padding 的 hidden state

最新推荐文章于 2024-06-27 08:49:26 发布

FocusOneThread

最新推荐文章于 2024-06-27 08:49:26 发布

阅读量734

点赞数

分类专栏：深度学习 TensorFlow

本文链接：https://blog.csdn.net/guotong1988/article/details/86581143

版权

TensorFlow 同时被 2 个专栏收录

230 篇文章 11 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

深度学习

212 篇文章 5 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

本文介绍如何在TensorFlow中有效地从循环神经网络（RNN）中获取最后一个非填充（non-padding）的隐藏状态，这对于序列建模任务至关重要。

摘要由CSDN通过智能技术生成

def collect_final_step_of_lstm(lstm_representation, lengths):
    # lstm_representation: [batch_size, passsage_length, dim]
    # lengths: [batch_size]
    lengths = tf.maximum(lengths, tf.zeros_like(lengths, dtype=tf.int32))

    batch_size = tf.shape(lengths)[0]
    batch_nums = tf.range(0, limit=batch_size) # shape (batch_size)
    indices = tf.stack((batch_nums, lengths), axis=1) # shape (batch_size, 2)
    result = tf.gather_nd(lstm_representation, indices, name='last-forwar-lstm')
    return result # [batch_size, dim]

用法：

from tensorflow.python.ops import rnn
self.outputs, _ = rnn.bidirectional_dynamic_rnn(
            lstm_cell_fw,
            lstm_cell_bw,
            self.inputs_emb

了解本专栏