这一篇主要是想根据Google的Colah的文章《Understanding LSTM Networks》阐述一下什么是LSTM(Long Short Time Memory)网络。
RNN:Recurrent or Recursive
RNN可以指代两种神经网络,Recursive Neural Network 以及Recurrent Neural Network,从英语的字面意思来说,前一种应该被称作递归神经网络,但是现在论文中提到的递归神经网络主要都指的是Recurrent Neural Network。
Recursive Neural Network是为了解决日常现象中一些递归结构的存在而特别设计的网络,比如在图像处理中一个表示车的图片中可以分为若干块小的零件图片,如窗户,轮子,但是这些代表窗户的图片也可能是飞机甚至是房子的一部分;比如在自然语言处理中出现的名词带的从句中又出现名词的情况。因此,Recursive Neural Network是一种对网络结构的重复,重复的网络权值构成一个树状结构,主要应用是图片分割与注释,在自然语言处理中也有应用。
Recursive Neual Network[1]
而Recurrent Neural Network则更偏重于时序上的处理,因此是一个链式的连接。