Torch中的RNN【1】这个package包括了RNN,RL,通过这个package可以很容易构建RNN,RL的模型。
安装:
luarocks install torch
luarocks install nn
luarocks install torchx
luarocks install dataload
如果有CUDA:
luarocks install cutorch
luarocks install cunn
记得安装:
luarocks install rnn
但是如果要使用nn.Reccurent,需要安装:【4】
理论篇
这一次主要是讲最简单的RNN,也就是Simple RNN。实现的话是根据这两篇论文:【6】,【7】
首先介绍一下Simple RNN的整个网络结构,再说一下 ρ step 的BPTT。
整个网络可以用下图来表示:(这种网络的输入一部分是当前的输入,另外一部分来自于hidden layer的上一个输出,这种叫做Elman Network。另外一种网络是一部分来自于当前输入,另外一部分来自于整个网络的上一个输出)
- 当前输入 wt 与上一个hidden layer的输出 st−1 两个vector相加,得到真正输入到网络里面的东西。
- 接着是把输入送进一个logistic regression里面,得到hidden layer: st . st 一方面往输出那条路径走,另外一方面往缓存或者叫做Context里面存起来,称为下一个输入需要的一部分,替换 st