LSTM 与GRU

最新推荐文章于 2023-12-22 21:34:52 发布

Mingsheng Zhang

最新推荐文章于 2023-12-22 21:34:52 发布

阅读量261

点赞数

分类专栏：机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/youhuakongzhi/article/details/114453378

版权

机器学习算法专栏收录该内容

6 篇文章 1 订阅

订阅专栏

LSTM

lstm简介

RNN把上一个状态传递到下一个状态，但是不能处理长依赖的问题，RNN的结构如下所示：

LSTM也有这种链式结构，但循环单元有着一种不同的结构。里面不再是只有单一的神经网络层，里面有四个，并且他们都以非常简单的方式起作用。

现在先不用担心内部的细节。我们稍后会一步一步来深入讲解LSTM。现在，我们先熟悉我们将要使用的定义：

在上面的图中，每行都有一个箭头，从一个结点的输出到另外的结点的输入。粉色的圆代表结点操作，比如向量相加，而黄色的长方形是学习的神经网络层。线的合并代表链接，而箭头的分叉代表内容复制后流向不同的位置。

GRU

GRU的结构如下，相对于LSTM，他们的区别如下：

GRU的参数更少，模型更简单，将原来的遗忘门和输入门变成单独的更新门，合并了它也合并了cell state和hidden state，因而训练稍快或需要更少的数据来泛化。
如果足够的数据，LSTM的强大表达能力可能会产生更好的结果。
GRU 有两个门（重置门与更新门），而 LSTM 有三个门（输入门、遗忘门和输出门）。
GRU 并不会控制并保留内部记忆（c_t），且没有 LSTM 中的输出门。
LSTM 中的输入与遗忘门对应于 GRU 的更新门，重置门直接作用于前面的隐藏状态。
在计算输出时并不应用二阶非线性。

参考：

https://zhuanlan.zhihu.com/p/34203833

LSTM 通俗理解：https://blog.csdn.net/v_JULY_v/article/details/89894058

GRU ：https://www.jiqizhixin.com/articles/2017-12-24

Mingsheng Zhang

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
LSTM 与GRU

LSTM 通俗理解：https://blog.csdn.net/v_JULY_v/article/details/89894058GRU ：https://www.jiqizhixin.com/articles/2017-12-24
复制链接

扫一扫

专栏目录

Mingsheng Zhang CSDN认证博客专家 CSDN认证企业博客

码龄6年

80: 原创

3万+: 周排名

124万+: 总排名

78万+: 访问

: 等级

5831: 积分

196: 粉丝

611: 获赞

103: 评论

2310: 收藏

私信

关注

分类专栏

进化算法 3篇
数学 5篇
python技术 6篇
SQL 7篇
机器学习算法 6篇
计算机操作基础 6篇
数据结构 2篇
离散优化 1篇
工具 7篇
大数据 25篇
Java 6篇
GO

最新评论

metabase Both left and right aliases encountered in JOIN
ZHAOYUNFENG?: 有解法吗？老哥
LSTM/GRU 出现预测值滞后现象
PersistWp: 可以试试多特征单步，单特征多步，递归预测
激活函数以0为中心的好处
勇敢牛牛，不怕困难801: 太清晰了
LSTM/GRU 出现预测值滞后现象
望津.: 大佬你好，受你启发我将数据先取对数ln之后预测曲线变“平滑”了，但是滞后现象依旧存在，是否说明滞后是由于数据本身的波动带来的，几乎不可避免呢
激活函数以0为中心的好处
Koi523: 太清晰了！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。