Keras学习:RNN及双向RNN

本文介绍了RNN、LSTM和GRU三种循环神经网络模型,包括它们的结构和参数设置。特别提到LSTM可以使用softsign激活函数替代tanh以减少饱和问题。还探讨了双向RNN的实现,通过wrappers包的Bidirectional模块,以及如何构建多层双向RNN(DBRNN)模型。最后,给出了两种不同结构的双向RNN模型示例。
摘要由CSDN通过智能技术生成

1.RNN:全连接RNN模型

SimpleRNN(Units,activation='tanh',dropout=0.0,recurrent_dropout=0.0, return_sequences=False)

2.LSTN:长短记忆模型

LSTM(units,activation='tanh',dropout=0.0,recurrent_dropout=0.0,return_sequences=False)
  • 对于 LSTM,可使用 softsign(而非 softmax)激活函数替代 tanh(更快且更不 容易出现饱和(约 0 梯度))。

3.GRU:门控循环单元

GRU(units,activation='tanh',dropout=0.0,recurrent_dropout=0.0,return_sequences=False)

4.双向RNN

双向RNN包装器

Bidirectional(layer,merge_mode='concat',weights=None)

参数说明:

layer:SimpleRNN、LSTM、GRU等模型结构

merge_mode:前向和后向RNN输出的结合方式,为sum,mul,concat,ave和None之一,若为None,则不结合,以列表形式返回.

BRNN模型

def BRNN():
    model=Sequential()
    model.add(Bidirectional(SimpleRNN(16,return_sequences=True),merge_mode='concat'))
    model.add(Flatten())
    model.add(Dense(1,activation='sigmoid'))
    return model

BRNN模型需要使用wrappers包的Bidirecitional模块实现双向RNN模型,并且要将return_sequences参数设置为True,因为如上文所述需要将前、后向的重要信息拼接起来,所以需要将整个序列返回,而不是只返回最后一个预测词。

DBRNN模型

def DBRNN():
    model=Sequential()
    model.add(Bidirectional(SimpleRNN(16,return_sequences=True),merge_mode='concat'))
    model.add(SimpleRNN(8))
    model.add(Flatten())
    model.add(Dense(1,activation='sigmoid'))
    return model

DBRNN模型的搭建也很方便,比如在这里我们要搭建一个两层的DBRNN模型,只需要再加一层SimpleRNN即可。要注意的是,如果要搭建多层DBRNN模型,除了最后一层SimpleRNN外,其他的SimpleRNN层都需要将return_sequences参数设置为True。

参考文献:https://blog.csdn.net/aizhushou/article/details/107457118

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值