BPTT-RNN训练算法

从RNN的模型可以看出,在反向传播时,在在某一序列位置t的梯度损失由当前位置的输出对应的梯度损失和序列索引位置t+1时的梯度损失两部分共同决定。

BP算法:定义误差函数 E ,通过链式法则自顶向下求得 E 对网络权重的偏导。沿梯度的反方向更新权重的值,直到 E 收 敛

BPTT:与BP类似,加上时序演化。

在这里插入图片描述

输出的激活函数:双曲正切,通过softmax,损失交叉熵。在这里插入图片描述

在这里插入图片描述
举一个例子:求E3对V的梯度
y是输出值,z是输入激活函数的值,z=V*S3.最后求和可得E对V的梯度!!(梯度下降)

在这里插入图片描述

E对W梯度

W是相同的,所有求对W的梯度需要求所有的。s2并不是一个常数项,s2依赖s1,s1依赖s0。所以要用链式法则传递下去。
在这里插入图片描述
这里刚开始看有点异或,当K=3的时候,粗浅以为左右式子对等,其实不然,是表达符号简略的问题!
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

RNN梯度消失的原因:
正是上面的BPTT和tanh激活函数。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值