lstm 变长序列_keras在构建LSTM模型时对变长序列的处理操作

最新推荐文章于 2022-08-30 00:21:40 发布

weixin_39559277

最新推荐文章于 2022-08-30 00:21:40 发布

阅读量178

点赞数

文章标签： lstm 变长序列

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39559277/article/details/111793160

版权

我就废话不多说了，大家还是直接看代码吧~

补充知识：RNN(LSTM)数据形式及Padding操作处理变长时序序列dynamic_rnn

Summary

RNN

样本一样，计算的状态值和输出结构一致，也即是说只要当前时刻的输入值也前一状态值一样，那么其当前状态值和当前输出结果一致，因为在当前这一轮训练中权重参数和偏置均未更新

RNN的最终状态值与最后一个时刻的输出值一致

输入数据要求格式为，shape=(batch_size, step_time_size, input_size),那么，state的shape=(batch_size, state_size);output的shape=(batch_size, step_time_size, state_size),并且最后一个有效输出(有效序列长度，不包括padding的部分)与状态值会一样

LSTM

LSTM与RNN基本一致，不同在于其状态有两个c_state和h_state，它们的shape一样，输出值output的最后一个有效输出与h_state一致

用变长RNN训练，要求其输入格式仍然要求为shape=(batch_size, step_time_size, input_size)，但可指定每一个批次中各个样本的有效序列长度，这样在有效长度内其状态值和输出值原理不变，但超过有效长度的部分的状态值将不会发生改变，而输出值都将是shape=(state_size,)的零向量(注：RNN也是这个原理)

需要说明的是，不是因为无效序列长度部分全padding为0而引起输出全为0，状态不变，因为输出值和状态值得计算不仅依赖当前时刻的输入值，也依赖于上一时刻的状态值。其内部原理是利用一个mask matrix矩阵标记有效部分和无效部分，这样在无效部分就不用计算了，也就是说，这一部分不会造成反向传播时对参数的更新。当然，如果padding不是零，那么padding的这部分输出和状态同样与padding为零的结果是一样的

再来怼怼dynamic_rnn中数据序列长度tricks

思路样例代码

以上这篇keras在构建LSTM模型时对变长序列的处理操作就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持服务器之家。

原文链接：https://blog.csdn.net/xinfeng2005/article/details/68926800

weixin_39559277

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。