RNN 公式及其推导

通过时间反向传播

t=1 t = 1 t=τ t = τ 应用如下更新方程:

a(t)=b+Wh(t1)+Ux(t) a ( t ) = b + W h ( t − 1 ) + U x ( t )

h(t)=tanh(a(t)) h ( t ) = t a n h ( a ( t ) )

o(t)=c+Vh(t) o ( t ) = c + V h ( t )

y^(t)=softmax(o(t)) y ^ ( t ) = s o f t m a x ( o ( t ) )

设损失函数 L(t) L ( t ) 为给定 x(1),...,x(τ) x ( 1 ) , . . . , x ( τ ) y(t) y ( t ) 的负对数似然,则:

L(x,y)=tlogpmodel(y(t)|{ x(1),...,x(τ)}) L ( x , y ) = − ∑ t l o g p m o d e l ( y ( t ) | { x ( 1 ) , . . . , x ( τ ) } )

=logexp(o(t)y(t))iexp(o(t)i) = − l o g e x p ( o y ( t ) ( t ) ) ∑ i e x p ( o i ( t ) )

=logy^(t) = − l o g y ^ ( t )

其中 i i

  • 3
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值