序列数据建模-RNN & Attention & self-Attention

最新推荐文章于 2024-04-28 14:10:09 发布

莫白墨

最新推荐文章于 2024-04-28 14:10:09 发布

阅读量1.3k

点赞数

文章标签： rnn 神经网络自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46856695/article/details/120925360

版权

—>了解更多

全连接神经网络具有层间相互连接，层内相互独立，输入和输出维数固定的特点，在针对不等尺寸图像、不定长度语句、不同词义字符等无约束序列长度，有约束序列依赖的输入数据建模时总会表现出一定的局限性。

在这里插入图片描述

1 循环神经网络

循环神经网络（RNN）的主要特点表现为t时刻的隐层（输出层）由第t-1时刻的隐层（输出层）与第t时刻的输入共同决定，其能够有效解决模型非定长输入与时序依赖问题。然而，当循环神经网络的结构过长时，较前输入对模型的影响会随着模型输入的更新不断降低，过长的梯度传播过程也容易引发梯度消失现象。虽然可以采用Relu函数或其它模型代替非线性激活函数，但更一般的做法是对其网络架构做出改进。

在这里插入图片描述

为了解决网络的长期依赖问题，提出了长短时记忆神经网络（LSTM）。该模型引入了一组记忆单元，允许网络学习何时遗忘历史信息，何时用新信息更新记忆单元，引入了元素取值为[0，1]的输入门、遗忘门和输出门，通过门机制控制信息流。门可选性地允许信息流动，由一个Sigmoid神经网络层与一个点乘运算组成，Sigmoid神经网络层输出0和1之间的数字

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
序列数据建模-RNN & Attention & self-Attention

全连接神经网络具有层间相互连接，层内相互独立，输入和输出维数固定的特点，在针对不等尺寸图像、不定长度语句、不同词义字符等无约束序列长度，有约束序列依赖的输入数据建模时总会表现出一定的局限性。1 循环神经网络循环神经网络（RNN）的主要特点表现为t时刻的隐层（输出层）由第t-1时刻的隐层（输出层）与第t时刻的输入共同决定，其能够有效解决模型非定长输入与时序依赖问题。然而，当循环神经网络的结构过长时，较前输入对模型的影响会随着模型输入的更新不断降低，过长的梯度传播过程也容易引发梯度消失现象。虽然可以采用R
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。