深度学习用于文本和序列

本文介绍了循环神经网络(RNN)及其变体LSTM在处理序列数据上的应用。RNN通过保存状态来处理序列信息,而LSTM通过门控机制解决了梯度消失问题。此外,还提到了一维卷积神经网络(CNN)在序列处理中的作用,以及如何结合RNN和CNN处理长序列。
摘要由CSDN通过智能技术生成

用于处理序列的两种基本的深度学习算法分别是循环神经网络和一维卷积神经网络。

循环神经网络,遍历所有序列元素,并保存一个状态,其中包含与已查看内容相关的信息。实际上,RNN是一类具有内部环恶神经网络。在处理两个不同的独立序列(比如两条不同的评论)之间,RNN的状态会被重置,因此仍可以将一个序列看作单个数据点,即网络的单个输入。真正改变的是,数据点不再是单个步骤中进行处理,相反,网络内部会对所有序列元素进行遍历。

一个简单的RNN传递过程:输入是一个张量序列,编码成(timesteps, input_features)。它对时间步(timesteps)进行遍历,在每个时间步,它考虑t时刻的当前状态和t时刻的输入(形状为input_features),对二者进行计算得到t时刻的输出。然后将下一个时间步的状态设置为上一个时间步的输出。对于第一个时间步,上一个时间步的输出没有定义,所以它没有当前状态,需要初始化为全零向量。                              

                                                                          图1 一个简单的RNN结构

增强版的RNN——长短时记忆网络(LSTM):增加了一种携带信息跨越多个时间步的方法。假设有一条传送带,其运行方向平行于你所处理

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值