CS231N assignment3 RNN

鱼鱼9901

已于 2023-07-11 19:05:41 修改

阅读量797

点赞数

分类专栏： CS231N 文章标签： rnn 人工智能深度学习

于 2023-07-11 11:56:05 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_72100405/article/details/131656304

版权

CS231N 专栏收录该内容

14 篇文章 3 订阅

订阅专栏

对作业进行一些形象的解释

首先是def rnn_step_forward：

这里的t时刻其实就是一个句子里面的单词数，为了方便会统一到一个最长长度，对于比这个长度短的部分用null进行填充，并且在方法内部会让Null不进行传播和梯度计算。

我们最终要的是h（shape是（N,T,H）），最终的h经过一系列后处理会得到新的句子

然后是def rnn_forward：

把rnn_step_forward循环T次（就得到模型产生的新句子了）

然后是train的forward，写在class Captioning RNN中的loss函数中：

这里的emb_caption 是由groundtruth的句子中的单词得来的emb，而在test中，除了第一个emb_caption是groundtruth以外，之后的每一步的emb_caption都是由上一步得到的next_h进行转换得到的。

test部分（写在class CaptioningSolver的sample中）：

最终的captions就是测试集所得到的新句子

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
CS231N assignment3 RNN

这里的emb_caption 是由groundtruth的句子中的单词得来的emb，而在test中，除了第一个emb_caption是groundtruth以外，之后的每一步的emb_caption都是由上一步得到的next_h进行转换得到的。这里的t时刻其实就是一个句子里面的单词数，为了方便会统一到一个最长长度，对于比这个长度短的部分用null进行填充，并且在方法内部会让Null不进行传播和梯度计算。我们最终要的是h（shape是（N,T,H）），最终的h经过一系列后处理会得到新的句子。
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。