RNN模型中使用得最多的是LSTM和GRU模型,LSTM主要通过输入门、输出门、遗忘门来有选择地遗忘,GRU类似,包含更新门、重置门两种门,本文主要对这2种模型对比下异同点,
表示当前状态,
表示上一个隐含层状态,
表示输入,输入门、输出门、遗忘门都采用sigmoid函数,使最终结果限定在0到1范围。
(1)遗忘门
RNN模型中使用得最多的是LSTM和GRU模型,LSTM主要通过输入门、输出门、遗忘门来有选择地遗忘,GRU类似,包含更新门、重置门两种门,本文主要对这2种模型对比下异同点,
表示当前状态,
表示上一个隐含层状态,
表示输入,输入门、输出门、遗忘门都采用sigmoid函数,使最终结果限定在0到1范围。
(1)遗忘门