深度学习学习笔记（3）

小赵研究生已考上

于 2024-07-26 10:42:59 发布

阅读量402

点赞数 3

文章标签：深度学习学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_58882109/article/details/140693837

版权

循环神经网络（RNN）

带时间序列的任务场景：

语音识别：输入一段语音，给出对应文字。
生成一段音乐
评论情感分析
DNA的序列分析
文字翻译

前后关联性强，前因后果。

标准神经网络的弊端

把每个单词都标注X1、X2.......X9，每个单词都作为一个神经元输入。

标准的神经网络建模的弊端：

输入输出数据在不同例子中有着不同的长度，例如我们换一句话进行翻译，输出和输出的长度就发生了改变。它输入端的神经元数量是预先设定的
一个单纯的神经网络结构，他并不共享从文本的不同位置上学到的特征。比如说如图中，X1是一个人名，但是换一句话之后，X1位置的单词并不一定是人名了。对于第二句话来说，神经网络就要重新开始学习了，或者Harry出现在其他位置时，神经网络就识别不出来了。
参数量巨大。输入网络的特征，往往是one hot或embedding，维度大。
不能体现出时序上的“前因后果”

所以标准的神经网络适不适合处理序列数据的。

而RNN就比较合适

RNN

网络结构

多输入，多输出

在时间T，模型输出值Yt取决于两个参数。1.隐藏层到输出层的连接权重Wy。2.当其状态值Ht。

输入值Xt和上期的状态值Ht- 1，通过相应的连接权重Wh和Wx加权相加，再通过激活函数tanh生成当期的状态值Ht。而Ht在下期计算中又会作为状态输入值与Xt+1一起参与到Ht+1的计算。

特点：

串联结构，体现出“前因后果”，后面结果的生成，要参考前面的信息。
所有特征共享一套参数。

我们可以通过梯度消失和链式法则计算出每次权重调整的大小。

可以看到，RNN也同样面临着梯度消失和梯度爆炸的问题。

例子：

参考：RNN双语_哔哩哔哩_bilibili

RNN案例

小赵研究生已考上

关注

3
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
深度学习学习笔记（3）

前后关联性强，前因后果。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。