LSTM部分问题汇总详解

最新推荐文章于 2024-03-13 09:18:00 发布

zjrn

最新推荐文章于 2024-03-13 09:18:00 发布

阅读量4.8w

点赞数 30

分类专栏： TensorFlow NLP 文章标签： LSTM TensorFlow 文本分类深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ZJRN1027/article/details/80301039

版权

本文主要解答关于LSTM在NLP任务中的常见问题，包括词向量维度（embedding size）是否必须等于LSTM隐藏层节点数（hidden size），在多层LSTM中的处理方式，以及LSTM的cell state和hidden state的理解。讨论了在TensorFlow中实现多层LSTM时可能出现的问题，并提出了解决思路。

摘要由CSDN通过智能技术生成

题记

LSTM（Long Short-Term Memroy Cell）是一种RNN网络的改进结构，相较于传统的RNN网络在处理长序列时有着很多优势这也让它在自然语言处理的多种任务中有着很广范的运用。关于LSTM的具体介绍有很多，大家也可以从我之前的一篇博客基于Tensorflow的LSTM-CNN文本分类模型中查看。

同时最近看到很多朋友对于LSTM的具体运用产生了一些疑问，而这些问题也是我之前在学习和项目中遇到的问题，这篇博客将在此对于这些问题进行详解，也算是个人学习的总结。

问题一：在NLP任务中，词向量维度（embedding size）是否一定要等于LSTM隐藏层节点数（hidden size）？

词向量（Word Embedding）可以说是自然语言处理任务的基石，运用深度学习的自然语言处理任务更是离不开词向量的构造工作。在文本分类，问答系统，机器翻译等任务中，LSTM的展开步数（num_step）为输入语句的长度，而每一个LSTM单元的输入则是语句中对应单词或词组的词向量。

对于embedding size是否一定要等于LSTM的hidden size 这样一个问题，我们可以通过了解单个LSTM单元的原理来进行回答。

我们输入LSTM的 input vector，也就是每个单词的word embedding这里称为vector A，LSTM的三个gate的控制是通过vector A来控制的，具体方法是通过乘以权重矩阵（weight），再加上偏置值（bias）形

最低0.47元/天解锁文章

关注

30
点赞
踩
134

收藏

觉得还不错? 一键收藏
9
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

zjrn CSDN认证博客专家 CSDN认证企业博客

码龄7年

70: 原创

5万+: 周排名

136万+: 总排名

28万+: 访问

: 等级

2771: 积分

127: 粉丝

224: 获赞

159: 评论

785: 收藏

私信

关注

分类专栏

Python 9篇
论文研读
NLP 29篇
LeetCode 47篇
TensorFlow 4篇
知识图谱 14篇
Linux 1篇
摘要生成 3篇
机器学习 4篇

最新评论

TensorFlow 2.1.0 使用 TFRecord 转存与读取文本数据
洛兮银儿: 什么都有给钱了现在csdn
文本分类模型第二弹：HAN(Hierarchy Attention Network)
安排653: HAN模型有基于pytorch框架实现的吗
基于Tensorflow的LSTM-CNN文本分类模型
欣坚强: 你好，现在我是想用CNN+LSTM实现股票预测，我的LSTM是完全手写的，所以就遇到了问题。就是，我设计了三层CNN，CNN输入的维度是（1，1，N）（N代表就是不确定），CNN最后还有一个flaten，那最终得到（1，M）。之后，就拿着这个进入LSTM层，由于M是不确定的，所以我想一个一个地输入到LSTM层里面去。那在一个一个预测的里面，需要进行LSTM的反向传播，那我是用LSTM的预测值与输入到LSTM层的CNN输出的值计算loss吗？还有就是，由于LSTM层手写，反向传播也是自己手写，那么，CNN反向传播我还可不可以用pytorch的自动求导机制啊？
文本分类模型第二弹：HAN(Hierarchy Attention Network)
草莓蛋糕yydz: 博主你的git账号是？
基于Tensorflow的LSTM-CNN文本分类模型
weixin_44062915: 请问找到test的代码了吗？

大家在看

最新文章

目录

评论 9

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。