Grid Long Short-Term Memory
本文主要引进了Grid LSTM,利用LSTM单元生成一个多维的网格,可以应用于向量,序列或者是更高维的数据例如图像。
本文是google deepmind发表
It therefore provides a unified way of using LSTM for both deep and sequential computation
本文主要想把RNN做深,不仅仅是序列的,而且还是深层网络 ,从维度上下手。主要就是利用LSTM隐层单元,构建一个网络结构。
这篇文章先讲了LSTM原理,又讲了stacked LSTM,然后是multidimensional LSTM,最后引出grid LSTM。
Grid LSTM可以在网络的任何维度扩展深度。在本文即将提到的序列预测问题中,我们设置了2维的网络,一个是序列本身,还有沿深度方向的另一维度。这些单元内部的值不能像multi LSTM一样简单的组合,我们待会会探讨一下他们究竟是如何把参数combine到一起的。
主要结构: