lstm数学推导_手推公式：LSTM单元梯度的详细的数学推导

最新推荐文章于 2023-03-26 19:21:22 发布

weixin_39650745

最新推荐文章于 2023-03-26 19:21:22 发布

阅读量753

点赞数

文章标签： lstm数学推导

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39650745/article/details/111723455

版权

本文详细介绍了长短期记忆网络（LSTM）单元的数学原理，包括遗忘门、输入门、输出门和单元状态的运作机制，并通过反向传播推导了各个门的梯度计算，旨在帮助读者理解LSTM的内部工作过程。

摘要由CSDN通过智能技术生成

长短期记忆是复杂和先进的神经网络结构的重要组成部分。本文的主要思想是解释其背后的数学原理，所以阅读本文之前，建议首先对LSTM有一些了解。

介绍

上面是单个LSTM单元的图表。我知道它看起来可怕,但我们会通过一个接一个的文章,希望它会很清楚。

解释

基本上一个LSTM单元有4个不同的组件。忘记门、输入门、输出门和单元状态。我们将首先简要讨论这些部分的使用，然后深入讨论数学部分。

忘记门

顾名思义，这部分负责决定在最后一步中扔掉或保留哪些信息。这是由第一个s型层完成的。

根据ht-1(以前的隐藏状态)和xt(时间步长t的当前输入)，它为单元格状态C_t-1中的每个值确定一个介于0到1之间的值。

遗忘门和上一个状态

如果为1，所有的信息保持原样，如果为0，所有的信息都被丢弃，对于其他的值，它决定有多少来自前一个状态的信息被带入下一个状态。

输入门

Christopher Olah博客的解释在输入门发生了什么：

下一步是决定在单元格状态中存储什么新信息。这包括两部分。首先，一个称为“输入门层”的sigmoid层决定我们将更新哪些值。接下来，一个tanh层创建一个新的候选值的向量，C~t，可以添加到状态中。在下一步中，我们将结合这两者来创建对状态的更新。

现在这两个值i。e i_t和c~t结合决

最低0.47元/天解锁文章

weixin_39650745

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
lstm数学推导_手推公式：LSTM单元梯度的详细的数学推导

长短期记忆是复杂和先进的神经网络结构的重要组成部分。本文的主要思想是解释其背后的数学原理，所以阅读本文之前，建议首先对LSTM有一些了解。介绍上面是单个LSTM单元的图表。我知道它看起来可怕,但我们会通过一个接一个的文章,希望它会很清楚。解释基本上一个LSTM单元有4个不同的组件。忘记门、输入门、输出门和单元状态。我们将首先简要讨论这些部分的使用，然后深入讨论数学部分。忘记门顾名思义，这部分负责决...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。