lstm数学推导_LSTM 数学公式和代码实现

最新推荐文章于 2024-07-18 15:25:54 发布

Shu Wang

最新推荐文章于 2024-07-18 15:25:54 发布

阅读量470

点赞数

文章标签： lstm数学推导

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_28716769/article/details/112035674

版权

https://www.cnblogs.com/liujshi/p/6159007.html

LSTM的推导与实现

前言

最近在看CS224d，这里主要介绍LSTM(Long Short-Term Memory)的推导过程以及用Python进行简单的实现。LSTM是一种时间递归神经网络，是RNN的一个变种，非常适合处理和预测时间序列中间隔和延迟非常长的事件。假设我们去试着预测‘I grew up in France...(很长间隔)...I speak fluent French’最后的单词，当前的信息建议下一个此可能是一种语言的名字(因为speak嘛)，但是要准确预测出‘French’我们就需要前面的离当前位置较远的‘France’作为上下文，当这个间隔比较大的时候RNN就会难以处理，而LSTM则没有这个问题。

LSTM的原理

为了弄明白LSTM的实现，我下载了alex的原文，但是被论文上图片和公式弄的晕头转向，无奈最后在网上收集了一些资料才总算弄明白。我这里不介绍就LSTM的前置RNN了，不懂的童鞋自己了解一下吧。

LSTM的前向过程

首先看一张LSTM节点的内部示意图：

图片来自一篇讲解LSTM的blog(http://colah.github.io/posts/2015-08-Understanding-LSTMs/)

这是我认为网上画的最好的LSTM网络节点图(比论文里面画的容易理解多了)，LSTM前向过程就是看图说话，关键的函数节点已经在图中标出,这里我们忽略了其中一个tanh计算过程。

g(t)i(t)f(t)o(t)s(t)h(t)======ϕ(Wgxx(t)+Wghh(t−1)+bgσ(Wixx(t)+Wihh(t−1)+biσ(Wfxx(t)+Wfhh(t−1)+bfσ(Woxx(t)+Wohh(t−1)+bog(t)∗i(t)+s(t−1)∗f(t)s(t)∗o(t)(1)(2)(3)(4)(5)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
lstm数学推导_LSTM 数学公式和代码实现

https://www.cnblogs.com/liujshi/p/6159007.htmlLSTM的推导与实现前言最近在看CS224d，这里主要介绍LSTM(Long Short-Term Memory)的推导过程以及用Python进行简单的实现。LSTM是一种时间递归神经网络，是RNN的一个变种，非常适合处理和预测时间序列中间隔和延迟非常长的事件。假设我们去试着预测‘I grew up in ...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。