论文复现“Reconstruction Network for Video Captioning“

最新推荐文章于 2023-06-04 12:00:23 发布

VIP文章放开我的鱿鱼

最新推荐文章于 2023-06-04 12:00:23 发布

阅读量887

点赞数 1

分类专栏：论文

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44906881/article/details/114666215

版权

目录

一、overview

这篇文章提出了一个新的编译码重构网络（RecNet），该网络的编码器-解码器（encoder-decoder）利用视频的前向流（视频到文字描述）和重构器（reconstructor）利用后向流（文字描述到视频），以缩小文字特征的重构误差来训练网络，使得网络更好生成视频的文字描述。
在这里插入图片描述
如上图所示:
(1) Encoder: 提取视频的视觉特征来获取视频的高层语义信息，给定的视频序列被编码为序列表示V={v1,v2 ,…,vm }，其中m表示视频帧的总数。
(2) Decoder: 在视频表示的基础上逐字生成字幕, hi是在LSTM中计算ith 的hidden状态，ci是使用时间注意机制计算的ith文本向量。
(3) Reconstructor: 从解码器的hidden状态序列再现视频，即以解码器的hidden状态H={h1，h2，…，hn}作为输入，再现由编码器生成的序列视频帧表示。

二、代码复现

参考博客 https://blog.csdn.net/weixin_40466548/article/details/110918205

安装环境
其顺序为离线安装pytorch 1.1.0、torchvision 0.3.0，
后在线安装cuda和cudnn然后运行run.py，
再安装模块一直到没有模块报错。

最低0.47元/天解锁文章

放开我的鱿鱼

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
2
评论
论文复现“Reconstruction Network for Video Captioning“

一、代码复现参考博客 https://blog.csdn.net/weixin_40466548/article/details/110918205安装环境其顺序为离线安装pytorch 1.1.0、torchvision 0.3.0，后在线安装cuda和cudnn然后运行run.py，再安装模块一直到没有模块报错。二、遇到环境安装问题conda安装虚拟环境时报错Segmentation fault (core dumped)原因：由于网络的原因导致有之前安装的包不完整，因此需要把之前
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。