1、首先,通过下图理解Convlstm识别手写数字的流程:
输入层:28*28大小的图片
将其每一行展开,形成一个1行784列的序列,符合RNN的输入模式。每一行作为一个RNN单元的输入,形成了图中28个RNN单元的计算模型。
2、最重要的是理解代码
_X: 表示的是一个batch(例如batch=5)的输入数据,此时_X是5*28*28,五张手写数字图片
对_X进行transpose操作,维度顺序更改的操作,由5*28*28变为28*5*28
对_X进行reshape操作,变为[5*28,28]
对28个隐层的数据进行计算并输出为_H(28个单元的隐藏层全部计算完成)