从RNN到LSTM

_Hsiung

于 2021-06-01 20:06:43 发布

阅读量201

点赞数 1

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bbwqsb/article/details/117423186

版权

机器学习专栏收录该内容

12 篇文章 0 订阅

订阅专栏

这里写目录标题

- RNN的引入

RNN的引入

RNN：具有记忆的神经网络。
一个词汇表示成一个Vector
在这里插入图片描述
输入一个向量，第n个词的输入和第n-1个词的输出相加，然后生成第n个词的概率

多层的

RNN的类别

两种Network

在这里插入图片描述

两边同时进行RNN

除了可以获取从头到尾的信息，还能获取从尾到头的信息。
在这里插入图片描述

LSTM

LSTM流程

简单来说，就是相比普通的RNN，LSTM能够在更长的序列中有更好的表现。现在的所说的RNN就是LSTM。
在这里插入图片描述
**一个局部LSTM：**每个f(x)函数都是用的sigmoid函数，就是生成0~1的值来表示这个阀门的打开程度大小。
流程：输入向量，输入门(Input Gate)以一定概率控制输入输入，遗忘门(Forget Gata)一一定概率记住这个值，然后输出门(Output Gate)以一定概率输出。

LSTM的参数是普通神经网络的四倍
在这里插入图片描述

深入LSTM结构

1、首先使用LSTM的当前输入 $x^t$ 和上一个状态传递下来的 $h^（t-1）$ 拼接经过线性激活函数训练得到四个状态。
在这里插入图片描述

RNN带来的梯度消失和梯度爆炸

RNN不好训练，因为梯度容易爆炸或者消失。
首先得明白RNN中梯度消失和平常的梯度消失不是一个概念。
RNN 所谓梯度消失的真正含义是，梯度被近距离梯度主导，导致模型难以学到远距离的依赖关系。
原因： 因为每次记忆都会覆盖上一次的值，长久的记忆下去，梯度被近距离梯度主导，远距离梯度很小，导致模型难以学到远距离的信息。
在这里插入图片描述

解决梯度消失的方法：LSTM

**原因：**一开始的LSTM没有遗忘门，也就是类似一个残差网络(ResNet)，上一次的数据完整的传给了下一次。后面产生遗忘门，每次都选择上次记忆的部分+这次的新值，不是直接覆盖。可以解决RNN中梯度消失的问题。

RNN的应用

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
从RNN到LSTM

一个词汇表示成一个Vector输入一个向量，第n个词的输入和第n-1个词的输出相加，然后生成第n个词的概率多层的两种Network两边同时进行RNN，除了可以获取从头到尾的信息，还能获取从尾到头的信息。LSTM**一个局部LSTM：**每个f(x)函数都是用的sigmoid函数，就是生成0~1的值来表示这个阀门的打开程度大小。流程：输入向量，输入门(Input Gate)以一定概率控制输入输入，遗忘门(Forget Gata)一一定概率记住这个值，然后输出门(Output Gate
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。