门控网络是一种循环神经网络 (RNN),它使用门来控制信息在时间步之间的流动。门是一种神经网络层,它可以选择性地允许或阻止信息通过。
门控网络的主要优点是它们可以解决传统 RNN 中存在的梯度消失问题。梯度消失是指随着时间步的增加,梯度会变得越来越小,最终变为零。这会导致 RNN 难以学习长期依赖关系。
门控网络有两种主要类型:
-
长短期记忆 (LSTM):LSTM 使用三个门:遗忘门、输入门和输出门。遗忘门决定从上一个时间步传递多少信息,输入门决定将多少新信息添加到隐藏状态,输出门决定将多少隐藏状态输出到下一个时间步。
-
门控循环单元 (GRU):GRU 使用两个门:重置门和更新门。重置门决定从上一个时间步重置多少信息,更新门决定将多少新信息添加到隐藏状态。GRU 的结构比 LSTM 简单,但在许多任务上性能相当。
门控网络在许多任务中都取得了成功&#