论文笔记:Grid Long Short-Term Memory

本文介绍Grid LSTM,一种能处理向量、序列及高维数据如图像的深度网络结构。Grid LSTM通过扩展LSTM在网络的任意维度增加深度,其核心在于构建的多维块接受并产生明确的隐层和记忆向量。实验表明,Grid LSTM在字符预测、翻译和图像分类等任务中表现出色,提供了一种统一的深度和序列计算方法。
摘要由CSDN通过智能技术生成

Grid Long Short-Term Memory


本文主要引进了Grid LSTM,利用LSTM单元生成一个多维的网格,可以应用于向量,序列或者是更高维的数据例如图像。
本文是google deepmind发表
It therefore provides a unified way of using LSTM for both deep and sequential computation
本文主要想把RNN做深,不仅仅是序列的,而且还是深层网络 ,从维度上下手。主要就是利用LSTM隐层单元,构建一个网络结构。

这篇文章先讲了LSTM原理,又讲了stacked LSTM,然后是multidimensional LSTM,最后引出grid LSTM。
Grid LSTM可以在网络的任何维度扩展深度。在本文即将提到的序列预测问题中,我们设置了2维的网络,一个是序列本身,还有沿深度方向的另一维度。这些单元内部的值不能像multi LSTM一样简单的组合,我们待会会探讨一下他们究竟是如何把参数combine到一起的。

主要结构:

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值