LSTM原理与前向代码实现

本文详细介绍了LSTM的工作原理,包括输入门、遗忘门、输出门和细胞状态的数学公式,并探讨了在实际编程中如何应用这些公式。接着,通过对ncnn库中LSTM层的代码分析,指出了存在的问题及其可能的原因。
摘要由CSDN通过智能技术生成

1. LSTM原理

LSTM是对序列数据进行处理的网络,首先这里给出LSTM的结构图,先知道它长什么样子吧。
在这里插入图片描述
网上很多的介绍给出LSTM有四个门,一个细胞状态,这里从程序编写的较多多了一个 g _ t g\_t g_t。那么对于这些的数学表达式怎么表述的呢?看下面的公式,下面这些公式代表了在实际运算过程中矩阵的运算关系,理解这个公式后面编写相关代码就容易多了,其中 σ \sigma σ代表 s i g m o i d sigmoid sigmoid激活函数。
对于输入门:
i _ t : = σ [ W h i ∗ h t − 1 + W x i ∗ x t + b i ] i\_t := \sigma [ W_{hi} * h_{t-1} + W_{xi} * x_t + b_i ] i_t:=σ[Whiht1+Wxixt+bi]
对于遗忘门:
f _ t : = σ [ W h f ∗ h t − 1 + W x f ∗ x t + b f ] f\_t := \sigma [ W_{hf} * h_{t-1} + W_{xf} * x_t + b_f ] f_t:=σ[Whfht1+Wxfxt+

  • 0
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值