Simple RNN Model

我们知道全连接网络FC Nets 和卷积神经网络ConvNets都是属于one to one 模型。比如给定一个输入如一张图片,我们输出他是猫还是狗。但是对于输入输出长度不一致的时序型数据sequential data(比如文本翻译)等就不适用。
先讲一下Simple RNN 模型

Simple RNN Model

X:词向量
h:状态
A:模型参数
h0包含the的信息,h1包含the 和 cat 的信息,以此类推,最后的ht包含了整句话的信息。
在这里插入图片描述
将上一次的状态与当前的词向量做连接与模型参数矩阵相乘再经过tanh激活函数得到新的状态:即新的状态ht依赖于上一次状态ht-1,向量Xt以及模型参数矩阵A。
在这里插入图片描述
A的维度:shape(h)*[shape(h)+shape(x)]
该模型,优点:擅长短的文本处理short-term dependence.,缺点:不擅长long-term dependence.长的会遗忘。

相关代码解读

选取的词维度为32,输出0,1,0负面评价,1正面评价。
在这里插入图片描述
在这里插入图片描述
后面+32是偏移量
在这里插入图片描述
比浅层模型高(上次 文本处理和词嵌入-Text Processing and Word Embedding那个75%左右)
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值