【cs231n】RNN LSTM

本文深入介绍了RNN(循环神经网络)和LSTM(长短期记忆网络)的工作原理,包括RNN的计算图、反向传播特点以及梯度消失问题。接着讲解了LSTM如何解决长距离依赖问题。最后,文章讨论了RNN在Image Caption任务中的应用,涉及词嵌入、训练与测试策略。
摘要由CSDN通过智能技术生成

RNN(Recurrent Neural Networks)

在这里插入图片描述
上图是RNN的计算图,输入为一定长度的时间序列X及隐藏层的初始态 h 0 h_0 h0,每一时刻的隐藏层都是由上一时刻的隐藏层 h t − 1 h_{t-1} ht1及当前的输入层X计算得到: h t = tanh ⁡ ( W x h ⋅ x t + W h h ⋅ h t − 1 + b ) h _ t = \operatorname { tanh } \left( W _ { xh } \cdot x _t + W _ { hh } \cdot h _{t - 1 }+ b \right) ht=tanh(Wxhxt+Whhht1+b)。输出则由当前时刻的隐藏层计算得到: y t = W h y h t y _ { t } = W _ { h y } h _ { t } yt=Whyht

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值