LSTM torch版本 输入输出格式

首先放上来下面两张经典的图,有助于理解LSTM网络结构。
在这里插入图片描述
在这里插入图片描述
这两张是比较LSTM网络内的计算图,值得一提的是在第一张图中,虽然有三个绿框,但实际上是不同时刻下的同一个LSTM网络,共享权重参数,该网络包含4个小黄框(代表4个神经元,4个激活函数,4个权重矩阵),这4个权重矩阵在不同时刻是共享。

与之类似,第三张图如下所示,在四个时刻虽然展开了,但仍然是同一个LSTM网络。图三用MLP的形式表达了图一绿框中的四个神经元的作用(四个神经元组成一层网络)。
在这里插入图片描述

下图四的每条横向蓝框,都是图三。竖向的depth其实就是torch中的num_layers,这个num_layers才是真正的LSTM网络的层数,因为每层不同时刻都是同一个LSTM网络。

值得一提的是,关于output和 h c h_c hc c n c_n cn的区别,从下图可看到,output就是最后一个layer上,序列中每个时刻(横向)状态h的集合。而 h c h_c hc实际上是每个layer最后一个状态(纵向)的拼接。也就是说 h n h_n hn[-1, :, :]就是output[-1, :, :]。
在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值