1.24CNN(基本框架),RNN(简单RNN,LSTM,GRU简要)两个参考论文

目录

CNN 

RNN 

3种RNN模型 

简单RNN

LSTM (长短期记忆模型)

GRU

参考论文 


CNN 

CNN是卷积神经网络

 

提取图片特征

在输出阶段可以使用sigmoid函数返回01值

RNN 

3种RNN模型 

简单RNN

 

 

 

 

 H就是每层神经元所产生的一个输出信号,输出层产生的信号经过输出函数转化为最终输出

随着循环次数的增加 

 

 

 

 就是说简单的RNN模型容易导致梯度消失以及梯度爆炸的问题

整体框架类似于数电里的状态机、时序逻辑电路

LSTM (长短期记忆模型)

 

S函数返回0到1,T函数返回-1到1 

 

而T 

 

 

当遗忘门值为0时,意味着上期记忆完全遗忘 ;为1时,完全保留

输入们用来更新记忆

 

简单RNN种

 

 

GRU

更新门与重置门 

 

 

 http://colah.github.io/posts/2015-08-Understanding-LSTMs/
https://arxiv.org/pdf/1412.3555v1.pdf

参考论文 

  • 15
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值