深度学习-RNN LSTM BI-LSTM

最新推荐文章于 2024-08-21 08:00:00 发布

陈塬升

最新推荐文章于 2024-08-21 08:00:00 发布

阅读量709

点赞数

分类专栏：深度学习文章标签：深度学习 python 人工智能神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/INFINALGEORGE/article/details/106539440

版权

本文介绍了循环神经网络RNN及其存在的梯度消失和梯度爆炸问题，然后详细阐述了LSTM如何通过门控机制解决这些问题，包括输入门、遗忘门和输出门的作用，以及细胞状态的更新过程。通过对LSTM的简化表示，揭示了其在信息传递上的优势。

摘要由CSDN通过智能技术生成

RNN 循环神经网络
RNN主要处理有时序关系的变长序列问题。每个神经元在每一时刻都一个特殊的hidden状态h(t)，由当前节点的输入I(t)和上一时刻t-1隐藏状态h(t-1)加权求和后经过一个非线性激活函数得到，具体表示成公式如下：
在这里插入图片描述
每个神经元t时刻隐状态

参数Whh决定了当前神经元以多少比例接受之前所有时刻[0,t-1]的输入信息

阻碍RNN发展的两个严重问题是：梯度爆炸和梯度消失、

RNN的对隐状态h(0)进行反向传播：
在这里插入图片描述
利用RNN时序上的依赖关系对上式进行展开，得到（注意，下式成立的前提是激活函数简化为线性函数）：

继续对

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

陈塬升 CSDN认证博客专家 CSDN认证企业博客

码龄5年

61: 原创

8万+: 周排名

194万+: 总排名

11万+: 访问

: 等级

1348: 积分

29: 粉丝

123: 获赞

12: 评论

386: 收藏

私信

关注

热门文章

分类专栏

深度学习 11篇
Camera算法 1篇
内核编程
工具及网站 1篇
python 7篇
机器学习 11篇
c++ 2篇
OpenCL 23篇
GPU 4篇
sql 1篇
鸡汤 1篇

最新评论

机器学习-多元线性回归（multiple linear regression）
Clare Adess: ValueError: Expected a 2-dimensional container but got <class 'pandas.core.series.Series'> instead. Pass a DataFrame containing a single row (i.e. single sample) or a single column (i.e. single feature) instead.代码整个复制下来报错0.0好像是数据格式有问题，这个怎么解决呀
vim编辑器替换以及全局替换
低调小冯: 哥们厉害
OpenCL 映射和解映射
67373_: 你好博主，我现在创建了映射，但是在核函数内读不到数据是什么原因？
深度学习-Ultra-Light-Fast-Generic-Face-Detector-1MB网络结构详解
weixin_46914428: 你倒是详解网络结构呀，复制粘贴算啥
OpenCL 图像处理函数、图像放缩和插值
海清: 请教，opencl对图像进行缩放，需要把输入图像转换成rgba类型的格式才能供read_imagef和write_imagef两个函数使用，而rgb转rgba及rgba转rgb比较耗时，那怎么能直接处理rgb类型的图像呢？谢谢

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。