RNN与LSTM两个小伙伴的学习笔记

最新推荐文章于 2024-08-16 21:16:24 发布

一指小菜鸡

最新推荐文章于 2024-08-16 21:16:24 发布

阅读量320

点赞数

文章标签：自然语言处理深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43506771/article/details/109022419

版权

这篇博客介绍了RNN及其存在的梯度消失和梯度爆炸问题，然后深入探讨了LSTM如何通过遗忘门、输入门和输出门解决这些问题，以处理更长的文本序列数据。内容包括RNN基本模型、LSTM的结构及各门的计算过程。

摘要由CSDN通过智能技术生成

这段时间一直在看NER相关的工作，终于把RNN以及LSTM的基本结构整理清楚了，于是接下来码一码，以便三天后又忘了找不到出处。其实大部分内容也是搬运来的。
在这里插入图片描述

RNN

首先介绍RNN，RNN全称循环神经网络。

在传统的深度神经网络模型中，我们的输入信息是没有顺序的。NLP领域中，我们输入单词经常使用embedding，将词汇映射为词向量，然后输入到神经网络。但是这种输入方式会有一些问题，比如，"我爱你"和"你爱我"在传统的神经网络中不能很好的识别。

在这种情况下，有人提出了将n-gram信息加入到输入层，比如fasttext，在一定程度上解决了单词间的顺序问题，但是这种方法也有一些弊端，就是我们无法捕获长句子的单词依赖，比如一个句子n个单词，那么如果想要捕获全部的单词顺序信息，需要1+2+3…+n，所以这种方式会让embedding_lookup变得非常大。

RNN就是专门解决这种无法捕获长距离的句子信息的模型。

简单来说，RNN侧重了时序，可以捕捉到句子之前的信息。

RNN模型

RNN的基本模型很简单。直接上图。一般来说分为输入层，隐藏层和输出层三个部分

最低0.47元/天解锁文章

一指小菜鸡

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。