lstm_dropout

最新推荐文章于 2024-01-08 01:25:45 发布

kakak_

最新推荐文章于 2024-01-08 01:25:45 发布

阅读量8.4k

点赞数 11

分类专栏： NLP

本文链接：https://blog.csdn.net/kakak_/article/details/106668407

版权

4 篇文章 1 订阅

订阅专栏

由于网络参数过多，训练数据少，或者训练次数过多，会产生过拟合的现象。
dropout是神经网络中避免过拟合最有效的正则化方法
dropout 每一层的神经元按照不同的概率进行dropout，这样每次训练的网络都不一样，对每一个的batch就相当于训练了一个网络，dropout本质是一种模型融合的方式，当dropout设置为0.5时，模型总类最多为2^n, 另外在更新参数时，只对保留的神经元进行更新，也能加快训练速度。
传统的dropout在rnn中使用的效果不是很好，因为rnn有放大噪音的功能，所以会反过来伤害模型的学习能力；
在rnn中使用dropout要在同一个t时刻中，多层cell之间传递信息的时候进行dropout，而不是神经元；从t-1状态传递到t时刻进行计算时，这中间不进行memory的dropout.

model.add(LSTM(100, dropout=0.2, recurrent_dropout=0.2))
model.add(Dropout(0.5))

在这里插入图片描述
dropout表示对 $W_x$ 的dropout，recurrent_dropout表示对 $W_h$ 的dropout.

关注