CS231N assignment3 RNN

对作业进行一些形象的解释

首先是def rnn_step_forward:

这里的t时刻其实就是一个句子里面的单词数,为了方便会统一到一个最长长度,对于比这个长度短的部分用null进行填充,并且在方法内部会让Null不进行传播和梯度计算。

我们最终要的是h(shape是(N,T,H)),最终的h经过一系列后处理会得到新的句子

然后是def rnn_forward:

把rnn_step_forward循环T次 (就得到模型产生的新句子了)

然后是train的forward,写在class Captioning RNN中的loss函数中:

 这里的emb_caption 是由groundtruth的句子中的单词得来的emb,而在test中,除了第一个emb_caption是groundtruth以外,之后的每一步的emb_caption都是由上一步得到的next_h进行转换得到的。

test部分(写在class CaptioningSolver的sample中):

最终的captions就是测试集所得到的新句子

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值