RNN算法

htfenght

已于 2024-05-22 21:15:15 修改

阅读量7.2k

点赞数 1

分类专栏：深度学习文章标签： rnn 算法人工智能

于 2018-03-08 10:49:38 首次发布

本文链接：https://blog.csdn.net/love__live1/article/details/79481281

版权

深度学习专栏收录该内容

8 篇文章 2 订阅

订阅专栏

机器学习算法完整版见fenghaootong-github

循环神经网络原理（RNN）

RNN是在自然语言处理领域中最先被用起来的
语言模型就是这样的东西：给定一个一句话前面的部分，预测接下来最有可能的一个词是什么。
简单的循环神经网络由输入层、一个隐藏层和一个输出层组成：

这里写图片描述

x是一个向量，它表示输入层的值（这里面没有画出来表示神经元节点的圆圈）；
s是一个向量，它表示隐藏层的值（这里隐藏层面画了一个节点，这一层其实是多个节点，节点数与向量s的维度相同）；
U是输入层到隐藏层的权重矩阵；
o也是一个向量，它表示输出层的值；
V是隐藏层到输出层的权重矩阵。
循环神经网络的隐藏层的值s不仅仅取决于当前这次的输入x，还取决于上一次隐藏层的值s。
权重矩阵 W就是隐藏层上一次的值作为这一次的输入的权重。

展开后:

这里写图片描述

$o_t = g(Vs_t)$
$s_t = f(Ux_t + Ws_{t-1})$

f,g都是激活函数
第一个式子是全连接层，第二个式子是循环层
循环层和全连接层的区别就是循环层多了一个权重矩阵 W。

$o_t = g(Vs_t) \\ = g(Vf(Ux_t + Ws_{t-1})) \\ = g(Vf(Ux_t + Wf(Ux_{t-1} + Ws_{t-2})))\\ = g(Vf(Ux_t + Wf(Ux_{t-1} + Wf(Ux_{t-2} + Ws_{t-3})))) \\ = g(Vf(Ux_t + Wf(Ux_{t-1} + Wf(Ux_{t-2} + Wf(Ux_{t-3} + ...)))))$

循环神经网络的训练

前向计算每个神经元的输出值 $a_j$ （表示网络的第j个神经元，以下同）；
反向计算每个神经元的误差项 $\sigma_j， \sigma_j$ 在有的文献中也叫做敏感度(sensitivity)。它实际上是网络的损失函数 $E_d$ 对神经元加权输入的偏导数
计算每个神经元连接权重 $w_{i,j}$ 的梯度（ $w_{i,j}$ 表示从神经元i连接到神经元j的权重）