RNN面试看这一篇就够了

最新推荐文章于 2024-05-04 00:10:47 发布

LotusQ

最新推荐文章于 2024-05-04 00:10:47 发布

阅读量897

点赞数

分类专栏：炼丹笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_30057549/article/details/103332234

版权

文章目录

1. 为什么选择序列模型

在这里插入图片描述

2. 数学符号

在这里插入图片描述
符号表示

词典用来表示单词。

上图是one-hot表示法，不在词表的单词标记为UNK。

3. 循环神经网络模型

对于这种序列任务，我们可以尝试用标准的神经网络，但是有两个问题：
在这里插入图片描述
即输入输出序列长度可能不等、不能共享不同位置上学到的特征。

这里是我们的第一个循环神经网络的例子，首先可以看到是T_x=T_y。从最左边看起，这里有一个零时刻的激活值，通常是零向量；在每一个时间步，输入向量x集合上一个神经元传过来的激活值，共同生成输出激活值，在经过一层线性变换以后输出y。
产生的问题：只用了序列前的信息，没有用到后面信息，后面双向循环神经网络会解决这个问题。
在这里插入图片描述
上图给出了循环神经网络的前向传播的例子，可以看到，每个隐藏单元输出两个值，一个是激活值，另一个是当前x对应的y。
$\begin{array}{c}{a^{<t>}=g_{1}\left(W_{a a} a^{<t-1>}+W_{a x} x^{<t>}+b_{a}\right)} \\ {\hat{y}^{<t>}=g_{2}\left(W_{y a} a^{<t>}+b_{y}\right)}\end{array}$

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。