keras学习笔记(五)：TimeDistributed详解+实战

最新推荐文章于 2021-05-13 15:58:57 发布

linxid

最新推荐文章于 2021-05-13 15:58:57 发布

阅读量9.4k

点赞数 2

分类专栏：人工智能 python 文章标签： keras NLP TimeDistributed RNN LSTM

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/linxid/article/details/86316250

版权

人工智能同时被 2 个专栏收录

38 篇文章 13 订阅

订阅专栏

26 篇文章 13 订阅

订阅专栏

本文是对[2]的翻译和整理，对简单的部分进行了删减，难懂的部分进行了又一次的讲解。
RNN、LSTM、GRU模型是我们常用并且效果非常好的模型，在众多的NLP任务中都可以看到他的身影。但有一层TimeDistributed，使用起来有些难度，尤其对初学者而言。接下来，说明TimeDistributed包装器的原理以及如何使用。

内容概览：

TimeDistributed层
序列学习Problem
One-to-One的LSTM 用于序列预测
Many-to-One LSTM 用于序列预测 (without TimeDistributed)
Many-to-Many LSTM 用于序列预测 (with TimeDistributed)

1.TimeDistributed层：

这一层是什么：
这个封装器将一个层应用于输入的每个时间片。
何时以及如何使用：
对3维以上的tensor，在时间维度上应用全连接。

假设我们有一些文本数据，假设每条样本32个字，一共64条样本，那么这些数据维度是（64,32）。我们对每个字做Embedding后，每个字变成100维的向量，那么这些数据维度变成（64,32,100）。此时我们是没法直接对其应用全连接网络（Dense Net）的，我们可以在时间维度上，对每个时间切片应用全连接。比如说我们抽取每条样本的第一个字，将会得到维度为（64,100）的数据，这样我们就可以对其应用全连接了。接下来将通过实例来讲解。

2. 序列学习问题：

参考资料：

[1] Keras官网文档介绍
 [2] How to Use the TimeDistributed Layer for Long Short-Term Memory Networks in Python

关注

2
点赞
踩
17

收藏

觉得还不错? 一键收藏
打赏
9
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 9

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

linxid 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。