LSTM及GRU图解

本文深入探讨了LSTM(长短期记忆网络)和GRU(门控循环单元)的工作原理,首先介绍了RNN的基础,然后详细阐述了LSTM的内部机制,包括如何处理输入和细胞状态。接着,对比了LSTM和GRU的结构差异,指出GRU具有更少的参数,没有细胞状态存储,这使得GRU在某些场景下更具效率。
摘要由CSDN通过智能技术生成

lstm也是一种递归神经神经网络,那么要了解lstm之前先看看什么是RNN

从上可以看出rnn有两个输入x1,h0;两个输出h1,y1.h1,x2作为下一时刻的输入,通过f函数,输出h2,y2;依次下去。。。。不管输入的序列有多长,只有一个f函数,那么自然减少了参数的数量;从上图也可看出为什么rnn可以作为时间序列的预测,




下面是 深层的RNN,只是多了一层,然后下一层的输出是上衣一层的输入


深层的RNN模型的另一种



RNN里面的函数实现


下面左图是RNN,右图是LSTM;从中可以看出LSTM比RNN多了一个输入,多一个输出,这就是传说中的细胞状态,说明LSTM具有长期依赖性。c变化的比较慢,h变化的比较快。c中保存的信息比较多,具有长期记忆的功能

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值