Long short-term memory
LSTM中的重复模块四个交互的层
1. 绿色的单元可以理解为tensorflow里的基本单元。每个cell底下Xt-1,Xt,Xt+1表示这是一个序列的数据,在每个时间点上都会有一个输入,如果这个问题对应到文本当中可能的xt对应的就是word,如果是对一个用户的行为序列去建模,那么这个Xt对应的就是每个用户的一个行为。RNN算法结构其实就是是一套时序神经网络网络。
2. 图中使用的各种元素的图标:
在上面的图例中,每一条黑线传输着一整个向量,从一个节点的输出到其他节点的输入。粉色的圈代表 pointwise 的操作,诸如向量的和,而黄色的矩阵就是学习到的神经网络层。合在一起的线表示向量的连接,分开的线表示内容被复制,然后分发到不同的位置。
3.LSTM 的核心思想
列表1LSTM中的重复模块四个交互的层,LSTM 的关键就是细胞状态,水平线在图上方贯穿运行。细胞状态类似于传送带。直接在整个链上运行,只有一些少量的线性交互。信息在上面流传保持不变会很容易
用RNN去解决LSTM中手写数字识别
有序列表1数据维度target维度,定义全局参数/超参数
<