循环神经网络RNN和长短期循环神经网络LSTM理论学习笔记

本文是关于循环神经网络RNN和长短期记忆网络LSTM的理论学习笔记,主要探讨RNN在处理时序问题上的局限以及LSTM如何通过门控机制解决这些问题。LSTM通过遗忘门、输入门和输出门有效地控制细胞状态,以处理长序列数据,避免梯度消失或爆炸。
摘要由CSDN通过智能技术生成

RNN和LSTM理论学习笔记

  • 出现原因:多层全连接的神经网络或者卷积神经网络只能处理当前状态。
  • 时序相关的问题:自然语言处理,视频图像处理、股票交易信息处理等。

循环神经网络RNN(Recurrent Neural Network)

  • 类型:
    (1)单向神经网络或者双向神经网络
    (2)循环神经网络和深度循环神经网络

  • 作用:处理短序列问题

在这里插入图片描述
X为输入层,是一系列的特征,用向量的形式表示;
O为输出,依然是一系列的向量,具体可以为物体的分类等;
h为神经元当前的状态;
U为输入X特征与隐藏层神经元全连接的权值矩阵;
V为隐藏层与输出层全连接的权值矩阵;
W为上一次隐藏层的输出到下一隐藏层的输入的权值矩阵;(一直更新)
隐藏层的输出取决于x、U、W;

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值