LSTM理解
神经网络会受到短时记忆的影响。如果一条序列足够长,那么他们将会很难将较早时间步提取的信息传送到后面的时间步上。也就是说如果处理一段文本信息,那么RNN可能会从一开始就遗漏一些在前面的重要的信息。所以LSYM要做的就是能够根据训练将较早出现的一些信息根据实际情况传递下去,让后面的时间步也能够使用到。
相关博客:LSTM详解
大名鼎鼎的LSTM详解
神经网络会受到短时记忆的影响。如果一条序列足够长,那么他们将会很难将较早时间步提取的信息传送到后面的时间步上。也就是说如果处理一段文本信息,那么RNN可能会从一开始就遗漏一些在前面的重要的信息。所以LSYM要做的就是能够根据训练将较早出现的一些信息根据实际情况传递下去,让后面的时间步也能够使用到。
相关博客:LSTM详解
大名鼎鼎的LSTM详解