【论文阅读笔记】CVPR2015-Long-term Recurrent Convolutional Networks for Visual Recognition and Description

最新推荐文章于 2022-03-31 09:45:07 发布

joshuaxx316

最新推荐文章于 2022-03-31 09:45:07 发布

阅读量2.9k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/joshuaxx316/article/details/69650952

版权

可能我这种分享方式并不利于其他同学找到相关内容，但是这样好方便啊，所以我就截图了。

这是一篇2015年的CVPR，但是后来改成了TPAMI，文章很经典，总结了整个序列模型的在三个任务上的应用。

本文是基于caffe框架实现的LSTM模型的训练，但是测试的时候，关于如何通过预测word来输入到LSTM模型，代替标注word，还未搞清楚

希望懂得同学告诉我inference的方法。

在这里正是留下这个问题：

当时用caffe做LSTM训练的时候，input_sentence通过编码输入到LSTM模型，然后生成predit_words，但是input_sentence和predict_words的维度都是(T, N, Dim)，因此通过一个T个时刻的输入得到T个时刻的预测words。当测试的时候，是没有input_sentence的，所以无法输入到LSTM, 往往通过当前时刻的predict_word输入到下一时刻，代替原先的input_sentence word，可是按照blob是T时刻的，如何能一个一个time step的得到predict_word啊?

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
【论文阅读笔记】CVPR2015-Long-term Recurrent Convolutional Networks for Visual Recognition and Description

这是一篇2015年的CVPR，但是后来改成了TPAMI，文章很经典，总结了整个序列模型的在三个任务上的应用。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。