如何在语言模型上使用S-RNN,参考Mikolov[2012]的博士论文。
进一步了解LSTM结构参考Alex Graves[2008]的博士论文以及Chris Olah的描述:http://colah.github.io/posts/2015-08-Understanding-LSTMs/。
训练LSTM网络时,Jozefowicz等人[2015]强烈建议将遗忘门的偏置项设置为接近1的值。
一些关于GRU和LSTM的结构的经验性探索参考Jozefowicz等人[2015]。
参考文献
最新推荐文章于 2024-08-08 14:52:01 发布