Higher Order Recurrent Neural Networks
添加链接描述
上篇的TTRNN那篇文章中,对RNN的结构描述非常抽象,不是很明白,找到了与之相关的HORNN这篇文章,继续研究一下。
之前看的TTRNN这种方法,就是提出了一种高阶的马尔科夫RNN以解决长时间依赖问题。其实这种方法就是借鉴于HORNN这篇文章,HORNN这篇文章2016就在arxiv上了,但是至今都没发出去。
与TTRNN那篇文章一样,将正常的RNN模型看作是一种一阶模型。
而与之相对应的则是高阶RNN模型,这篇文章给出的定义感觉更加清晰一些。HORNN的作者提出,其实这种高阶模型只是在原始的RNN模型中增加了几个记忆单元(h),并且在反馈计算的时候,分别以不同的权重反馈。
其大致的模型如上所示。左边的为正常的RNN单元,右边的则是三阶RNN单元。可以看到,一阶的话只需要更新一个权重矩阵,而三阶RNN则需要更新三个权重矩阵。