对RNN中Output与State的区分

本文旨在澄清在RNN,特别是LSTM模型中Output与State的区别。基础RNN的Output通过全连接层从State生成,而在Tensorflow的BasicRNN中,Output是所有state的集合,最后一个Output等于finalState。LSTM的State由Ct和ht组成,而Output仅依赖于ht。如果不添加全连接层,LSTM的output[-1]与finalState的部分内容相同。
摘要由CSDN通过智能技术生成

对RNN中Output与State的区分

之所以写这篇文章,主要是在之前实现Seq2Seq模型时发现了一些问题,在这方面有着一些混淆,主要是对LSTM的理解不够


基础RNN的结构,每一个RNN单元实现的功能是
(插不来图,请自找。。。。)
S t = f ( S t − 1 , x t ) S_t = f(S_{t-1},x_t) St=f(St1,xt)
那么 O t O_t O

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值