文章目录 1. 概要1. 结构2. 候选记忆单元3. 记忆单元4. 阴状态 小结 1. 概要 提示:概要 长期以来,隐变量模型存在着长期信息保存和短期输入缺失的问题。解决这一问题的最早方法之一是长短期存储器。长短期记忆网络的设计灵感来自于计算机的逻辑门。 1. 结构 2. 候选记忆单元 3. 记忆单元 4. 阴状态 小结 • 长短期记忆网络有三种类型的门:输入门、遗忘门和输出门。• 长短期记忆网络的隐藏层输出包括“隐状态”和“记忆元”。只有隐状态会传递到输出层,而记忆元完全属于内部信息。• 长短期记忆网络可以缓解梯度消失和梯度爆炸。