循环神经网络Rnn是干什么的:
普通的神经网络只能处理单一时刻的数据,而要处理序列化的数据时,即前后数据相关联时,就要用到Rnn.例如,音频的语音识别, 文字的机器翻译,视频行为识别,文本情感分析,命名实体识别等。
举个命名实体识别的例子:1北京东面有什么好玩的地方 2在京东买东西,一天就能到家,经过rnn模型计算后,1的实体为北京,2的实体为京东;即根据前后文关系,例子1中的京东就不会被识别为实体,而真正的实体是北京(所谓的命名实体就是人名、机构名、地名以及其他所有以名称为标识的实体)
Rnn结构:
先来看前向传播,如下图所示(取自达叔视频):
也可以这样表示:
输入层:x<t>是one-hot向量,即只有一个位置为1,其他都为0的向量;
隐藏层: