Tensorflow与RNN、双向LSTM等的踩坑记录及解决

大富大贵7

于 2024-01-14 07:23:50 发布

阅读量25

点赞数

分类专栏：程序员知识储备文章标签：经验分享

本文链接：https://blog.csdn.net/Sapphire521/article/details/135579222

版权

程序员知识储备专栏收录该内容

425 篇文章 15 订阅 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

本文详细记录了使用TensorFlow处理不定长文本序列的步骤，包括数据读取、序列预测与拟合、多任务设置、zero padding的处理方法，以及解决双向LSTM信息瓶颈的策略，如序列拼接、平均值和池化操作。

摘要由CSDN通过智能技术生成

1、tensorflow（不定长）文本序列读取与解析

tensorflow读取csv时需要指定各列的数据类型。

但是对于RNN这种接受序列输入的模型来说，一条序列的长度是不固定。这时如果使用csv存储序列数据，应当首先将特征序列拼接成一列。

例如两条数据序列，第一项是标签，之后是特征序列

[0, 1.1, 1.2, 2.3] 转换成 [0, '1.1_1.2_2.3']

[1, 1.0, 2.5, 1.6, 3.2, 4.5] 转换成 [1, '1.0_2.5_1.6_3.2_4.5']

这样每条数据都只包含固定两列了。

读取方式是指定第二列为字符串类型，再将字符串按照'_'分割并转换为数字。

关键的几行代码示例如下：

def readMyFileFormat(fileNameQueue):
    reader = tf.TextLineReader()
    key, value = reader.read(fileNameQueue)

    record_defaults = [["Null"], [-1], ["Null"], ["Null"], [-1]]
    phone1, seqlen, ts_diff_strseq, t_cod_strseq, userlabel = tf.decode_csv(value, record_defaults=re