关于lstm的tensorflow实现
1.lstm的原理理解:
在介绍lstm之前需要先对RNN进行初步理解:
RNN相当于是有很多个神经网络单元,然后将他们按照时间的先后顺序进行连接起来,在文本中的应用就是相当于能够基于神经网络来学习到句子之间词之间的某种关系,但是这时候会存在一个缺陷,当句子很长的时候,神经网络整个生态体系容易产生梯度消失现象,这时候没法让整个生态结构能够学习出相应的结构出来;基于此种现象的产生,后来很多学者对此进行过很多改进,其中比较经典的就是产生了LSTM的学习框架,能够解决梯度消失的问题,它的主要框架结构是增加了忘记门层、输入门层和输出门层和细胞层,这样保证了有效信息的有效利用,从语义层面解决了句子之间的理解;