RNN和LSTM理论学习笔记
- 出现原因:多层全连接的神经网络或者卷积神经网络只能处理当前状态。
- 时序相关的问题:自然语言处理,视频图像处理、股票交易信息处理等。
循环神经网络RNN(Recurrent Neural Network)
-
类型:
(1)单向神经网络或者双向神经网络
(2)循环神经网络和深度循环神经网络 -
作用:处理短序列问题
X为输入层,是一系列的特征,用向量的形式表示;
O为输出,依然是一系列的向量,具体可以为物体的分类等;
h为神经元当前的状态;
U为输入X特征与隐藏层神经元全连接的权值矩阵;
V为隐藏层与输出层全连接的权值矩阵;
W为上一次隐藏层的输出到下一隐藏层的输入的权值矩阵;(一直更新)
隐藏层的输出取决于x、U、W;