【论文阅读笔记】CVPR2015-Long-term Recurrent Convolutional Networks for Visual Recognition and Description

可能我这种分享方式并不利于其他同学找到相关内容,但是这样好方便啊,所以我就截图了。

这是一篇2015年的CVPR,但是后来改成了TPAMI,文章很经典,总结了整个序列模型的在三个任务上的应用。

本文是基于caffe框架实现的LSTM模型的训练,但是测试的时候,关于如何通过预测word来输入到LSTM模型,代替标注word,还未搞清楚

希望懂得同学告诉我inference的方法。

在这里正是留下这个问题:

当时用caffe做LSTM训练的时候,input_sentence通过编码输入到LSTM模型,然后生成predit_words,但是input_sentence和predict_words的维度都是(T, N, Dim),因此通过一个T个时刻的输入得到T个时刻的预测words。当测试的时候,是没有input_sentence的,所以无法输入到LSTM, 往往通过当前时刻的predict_word输入到下一时刻,代替原先的input_sentence word,可是按照blob是T时刻的,如何能一个一个time step的得到predict_word啊?





  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值