深度学习笔记 -- RNN(一)

本文介绍了RNN在处理序列数据的优势,详细讲解了RNN模型结构、前向传播算法,并探讨了BPTT训练方法及梯度消失、梯度爆炸问题。重点讨论了激活函数对模型的影响,并提出ReLU和LSTM结构作为解决方案。
摘要由CSDN通过智能技术生成

1、RNN介绍

在CNN和DNN中,训练样本的输入和输出是比较确定的,但是在比如基于时间的序列中,序列的长短是不一定的,很难直接拆分成一个个独立的样本来通过CNN或者DNN进行训练。

对于这类问题,RNN则比较擅长。比如是从序列索引1到序列索引r的。对于这其中的任意序列的索引号t,它对应的输入是对应的样本序列中的X^{(t)}。而模型在序列索引号t的位置的隐藏状态h^{(t)},则由X^{(t)}和在t-1位置的隐藏状态h^{(t-1)}共同决定。在任意序列索引号t,我们也有对应的模型预测输出o^{(t)}和训练序列真实输出y^{(t)},以及损失函数L^{(t)},我们就可以用DNN类似的方法训练模型,接着用来预测测试序列中的一些位置的输出。

2、RNN模型

以下介绍的是最常见的RNN模型;

这幅图描述了在序列索引号tt附近RNN的模型。其中:

    1)

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值