lstm学习

最新推荐文章于 2024-06-26 21:44:15 发布

yolan6824

最新推荐文章于 2024-06-26 21:44:15 发布

阅读量495

点赞数

分类专栏：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yolan6824/article/details/86773459

版权

人工智能专栏收录该内容

15 篇文章 0 订阅

订阅专栏

讲的特别好的lstm：lstm介绍

1.simpleRNN

2.standardRNN

使用了隐含层的信息

3.

信息的表示：c^(t) = f(W.x(t) + U.y(t-1))

长时记忆单元：C(t) = gforget*C(t-1) + gin*c^(t)

输出：y(t) = gout*f(C(t))

隐状态：h(t) = y(t)

其中，gin,gout,gforget是三个控制门,控制门的取值范围是0-1，因此使用sigmoid为激活函数。

4.lstm的所有数学公式

LSTM数学推导

公式讲解：

这里的ft,it,和ot是lstm中的三个控制门，分别是遗忘门，输入门，和输出门。公式表示，这三个门与ht-1,和xt有关，由于三个门通过输出一个0-1间的数字来控制门的开关程度，从而控制信息的流出程度，因此使用sigmoid函数作为激活函数，而这激活函数的输入就是ht-1,和xt。

需要注意的是，[ht-1,xt]这里是指拼接的意思，ht-1和xt的向量拼接在一起。

C^t就是上面推导的信息的表示，使用tanh作为激活函数。

tanh的图像是：

输出范围是-1~1。

Ct表示长时记忆。

这里的ht同时表示输出和隐层状态。

5.改进版的三个门

lstm的变体：加入了peephole

变体的变主要体现在三个门的公式中，在这里，三个门的输出状态不仅与ht-1,xt有关，还与细胞的前状态Ct-1有关，而到了最后，Ct-1已经转换成了Ct，所以输出门的状态还与当前的细胞状态有关。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

yolan6824 CSDN认证博客专家 CSDN认证企业博客

码龄8年

54: 原创

43万+: 周排名

108万+: 总排名

3万+: 访问

: 等级

816: 积分

6: 粉丝

11: 获赞

9: 评论

40: 收藏

私信

关注

分类专栏

android 11篇
网络 1篇
okhttp 6篇
JAVA 10篇
okio 4篇
人工智能 15篇
python 3篇
就业 1篇
计算机基础 3篇
linux 3篇

最新评论

Collection(3) HashSet源码解析
CSDN-Ada助手: 不知道 Java 技能树是否可以帮到你：https://edu.csdn.net/skill/java?utm_source=AI_act_java
论如何找tensorflow的源码
小五design: 哎呀，棒呀，简单粗暴有效
论如何找tensorflow的源码
布什先生.: 终于找到了
论如何找tensorflow的源码
ＷuHe: 服务器上能安装pycharm？你说的本地电脑把
论如何找tensorflow的源码
kx.: 棒！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。