LSTM的参数量计算

1.LSTM简单介绍

(产生矩阵变化的都是下面图中的红色部分 一共有四个 上面那个tanh由于维度正确,只需要激活即可,没有矩阵变换)
在这里插入图片描述
LSTM只有一个,他的权重都是共享的
红框从左到右,依次是:

  • 忘记门层: 决定从细胞状态中丢弃什么信息,通过当前时刻输入和前一个时刻输出决定
  • 细胞状态: 确定并更新新信息到当前时刻的细胞状态中
  • 输出门层: 基于目前的细胞状态决定该时刻的输出

2.简单假设样例

假设现有一个样本,Shape=(13,5),时间步是13,每个时间步的特征长度是5.形象点,我把一个样本画了出来:

在这里插入图片描述
一个样本
使用Keras框架添加LSTM层时,我的设置是这样的keras.layers.LSTM(10),也就是我现在设定,每个时间步经过LSTM后,得到的中间隐向量是10维(意思是5->10维),13个时间步的数据进去得到的是(13*10)的数据.

每个时间步对应神经元个数(参数个数)一样.也就是算一个LSTM中神经元个数,算一个时间步中参与的神经元个数即可.下面将对LSTM每个计算部分进行神经元分析.

3.神经元分析

3.1忘记门层

在这里插入图片描述

图中公式的是上一个状态的隐向量(已设定隐向量长度为10),为当前状态的输入(长度为5),通过拼接起来,那么的长度就是10+5=15了.和为该层的参数.

该层输出是中间隐向量的长度(10),经过激活前后的长度不变.只需要考虑里面的操作得到10维特征即可.

[ht-1,xt]是(1,15)的向量,与Wf相乘得到(1,10)的向量,根据矩阵相乘规律,得到是(15,10)的矩阵,得到(1,10)矩阵后,与该门层偏置相加,偏置也应该有相同的形状,即bf是(1,10)的矩阵.

即:该层神经元为:
在这里插入图片描述

3.2细胞状态

(1)确定更新信息过程
在这里插入图片描述

可以看到,这里公式和前面的一样的,和都是激活函数,不影响参数个数.

同理这过程的神经元个数是:

在这里插入图片描述

(2)更新过程

在这里插入图片描述

公式中的四个值,均是前面计算得到的结果,因此该过程没有参数需要学习.

3.3输出层

在这里插入图片描述

一样的公式,神经元个数一样.即个数为:
在这里插入图片描述

3.4总结
把公式(1),(2),(3)的神经元加起来,就是该LSTM的神经元个数了.

在这里插入图片描述

其实,我们可以把这个问题一般化,不看这个例子,假设你一个时间步的特征长度是n,经过该LSTM得到的长度是m,这样就可以算出该LSTM层的神经元个数为:
在这里插入图片描述

  • 5
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在 MATLAB 中,可以使用 Neural Network Toolbox 中的 LSTM 网络来进行回归任务。LSTM(长短期记忆)是一种循环神经网络,适用于处理具有时间序列结构的数据。 要使用 LSTM 网络进行回归,需要设置网络的参数。以下是一些常见的参数: 1. 隐藏层大小(numHiddenUnits):这是 LSTM 网络中隐藏状态的维度,影响网络的容量。通常,较大的隐藏层大小可以提供更好的建模能力,但也可能导致过拟合。 2. 层数(numLayers):LSTM 网络可以有多个堆叠的 LSTM 层。通过增加层数,网络可以学习更复杂的模式。然而,层数过多也会增加训练时间和计算复杂度。 3. 学习率(learnRate):这是网络在每次迭代时更新权重的步长。较小的学习率可能导致收敛速度过慢,而较大的学习率可能导致训练不稳定。可以根据具体问题进行调整。 4. 最大迭代次数(maxEpochs):这是训练过程中的最大迭代次数。可以根据训练误差和验证误差的变化情况来确定合适的值。 5. 正则化参数(regularization):可以通过正则化来控制网络的复杂度,防止过拟合。常见的正则化方法包括 L1 正则化和 L2 正则化。 这些只是一些基本的参数设置,实际使用时还需要根据具体问题进行调整。可以通过 MATLAB 中的 `lstmLayer` 和 `trainingOptions` 函数来设置这些参数,并使用训练数据对 LSTM 网络进行训练。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值