LSTM学习脚步

入门
colah’s blog

Andrej Karpathy blog

论文:
Convolutional LSTM Network: A Machine Learning Approach for Precipitation Nowcasting

代码1

8个权重分别使用8个不同的卷积进行生成。实现了多层LSTM。首先对每层的h和c进行初始化。对于同一个时间step的不同层,前一层的h层输出作为下一层的输入。
代码写的挺好,只是没有训练方法。首先在第一个时间序列的每个隐藏层之间传递,接着在第二个时间序列的隐藏层之间传递。

代码2

与代码1不同的是,没有单独生成8个权重。直接将h和输入拼接通过一个卷积层,直接生成4个输出,分别是f,i,g,o。通过这4个输出运算后得到h和c。变量解释,num_features为c和h的通道数,比如c的维度是(num_features,x,y)。filter_size为滤波器核大小。batch_size为batch大小。shape为输入和特征图大小。inp_chans为输入图像的通道数。nlayers为隐藏层个数,即多层LSTM层数。seq_len为多少个时间序列。首先在第一个隐藏层按照时间序列正向传播,然后再第二个隐藏层进行正向传播。
虽然两种传播方式不同,但是最终效果相同。

这里是一个差不多pytorch文档翻译的小教程

这里是相应的反向传播推导

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值