深度学习用于文本和序列

最新推荐文章于 2024-01-15 18:05:19 发布

逍遥的狐狸

最新推荐文章于 2024-01-15 18:05:19 发布

阅读量504

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41430572/article/details/89738384

版权

本文介绍了循环神经网络（RNN）及其变体LSTM在处理序列数据上的应用。RNN通过保存状态来处理序列信息，而LSTM通过门控机制解决了梯度消失问题。此外，还提到了一维卷积神经网络（CNN）在序列处理中的作用，以及如何结合RNN和CNN处理长序列。

摘要由CSDN通过智能技术生成

用于处理序列的两种基本的深度学习算法分别是循环神经网络和一维卷积神经网络。

循环神经网络，遍历所有序列元素，并保存一个状态，其中包含与已查看内容相关的信息。实际上，RNN是一类具有内部环恶神经网络。在处理两个不同的独立序列（比如两条不同的评论）之间，RNN的状态会被重置，因此仍可以将一个序列看作单个数据点，即网络的单个输入。真正改变的是，数据点不再是单个步骤中进行处理，相反，网络内部会对所有序列元素进行遍历。

一个简单的RNN传递过程：输入是一个张量序列，编码成（timesteps, input_features）。它对时间步(timesteps)进行遍历，在每个时间步，它考虑t时刻的当前状态和t时刻的输入(形状为input_features)，对二者进行计算得到t时刻的输出。然后将下一个时间步的状态设置为上一个时间步的输出。对于第一个时间步，上一个时间步的输出没有定义，所以它没有当前状态，需要初始化为全零向量。

图1 一个简单的RNN结构

增强版的RNN——长短时记忆网络（LSTM）：增加了一种携带信息跨越多个时间步的方法。假设有一条传送带，其运行方向平行于你所处理

最低0.47元/天解锁文章

逍遥的狐狸

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。