复现 “Reconstruction Network for Video Captioning” CVPR 2018

最新推荐文章于 2023-03-06 15:18:52 发布

华工最后的温柔

最新推荐文章于 2023-03-06 15:18:52 发布

阅读量718

点赞数 2

分类专栏：代码复现文章标签： ubuntu 深度学习 python pytorch 自然语言处理

本文链接：https://blog.csdn.net/weixin_40466548/article/details/110918205

版权

论文复现RecNet

论文链接：https://paperswithcode.com/paper/reconstruction-network-for-video-captioning
github工程链接：https://github.com/hobincar/RecNet

环境配置

基于RTX2080Ti的服务器, Ubuntu16.04系统
cuda 10.0,
cudnn 7.5.1
pytorch 1.1.0
torchvision 0.3.0
其他环境按照论文的requirement.txt来，报错缺啥模块就安装啥

首先在Anaconda下创建一个虚拟环境并激活

#创建虚拟环境
conda create -n rn python=2.7.12
#退出base环境
conda deactivate
#激活环境
conda activate rn

其次在清华源头下载安装包

https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/

我选择linux-64，然后选择python2.7、pytorch1.1.0、cuda10
同时还要选择和 pytorch1.1.0 匹配的 torchvision0.3.0

安装包下好之后，我的目录如下：

在这里插入图片描述

执行下列命令：

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

华工最后的温柔

关注关注

2
点赞
踩
7

收藏

觉得还不错? 一键收藏
6
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

论文复现“Reconstruction Network for Video Captioning“

weixin_44906881的博客

03-11

1085

一、代码复现参考博客 https://blog.csdn.net/weixin_40466548/article/details/110918205 安装环境其顺序为离线安装pytorch 1.1.0、torchvision 0.3.0，后在线安装cuda和cudnn然后运行run.py，再安装模块一直到没有模块报错。二、遇到环境安装问题 conda安装虚拟环境时报错Segmentation fault (core dumped) 原因：由于网络的原因导致有之前安装的包不完整，因此需要把之前

论文介绍--Memory-Attended Recurrent Network for Video Captioning

信道者

01-07

1190

在视频描述模型中加入记忆体

6 条评论您还未登录，请先登录后发表或查看评论

论文阅读 | Event-based Video Reconstruction via Potential-assisted Spiking Neural Network

bettii的博客

12-13

450

用SNN脉冲神经网络做基于事件相机的图像重建的文章

video caption任务简介

01-29

video caption 目的：从一段视频中自动生成一段描述性文字，用以展现视频中的主要特征以及特征之间的关系。方法：基于视频的特征提取以及循环神经网络的语义生成

Detail-recovery Image Deraining via Context Aggregation Networks 网络结构分析

weixin_45271005的博客

10-29

1194

《Detail-recovery Image Deraining via Context Aggregation Networks》这篇文章选自CVPR2020，针对图像去雨过程中的细节损失恢复问题提出了可拆卸细节补充模块，接下来重点分析一下网络结构和实现代码。这个一个两分支并行结构，两条并行分支分别是提取雨水条纹的RRN和提取图像细节的DRN。输入的雨图传入到RRN得到输出雨条纹RAIN STREAKS，同时将雨图传入到DRN得到输出的细节补充Detail Repair Feature，再把雨图减去

CVPR2018下载+CVPR2018论文百度云+2018CVPR论文下载+2018CVPR百度云

王博（Kings）的博客

06-25

4950

链接：https://pan.baidu.com/s/1QUXtDp5RQVNx-R55TkL13Q 提取码：

【CVPR2018】3D Semantic Trajectory Reconstruction f

06-14

【CVPR2018】3D Semantic Trajectory Reconstruction from 3D Pixel Continuum 是一篇在计算机视觉领域的重要研究论文，发表于2018年的计算机视觉与模式识别会议（CVPR）。这篇工作主要聚焦于从三维像素连续体中重建...

Yao_Feng_Joint_3D_Face_ECCV_2018_paper_CVPR2018_

10-04

该论文的研究工作是在CVPR2018（计算机视觉与模式识别会议）的基础上进一步深化的，这两个会议都是计算机视觉领域的顶级盛会，汇集了全球顶尖的研究成果。在3D人脸识别技术中，关键在于准确地捕捉和理解人脸的三维...

video-caption 的应用实现

sl_950313的专栏

01-23

2313

理论基础基于yaoli在ICCV2015上的一篇文章的实现搭建的。环境系统环境 GPU ： Nvidia Tesla K80 (4个，这里只用一个) System: 127-Ubuntu x86_64 GNU/Linuxx CPU : Intel(R) Xeon(R) CPU E5-2680 v4 @ 2.40GHz 6核28处理单元 Memory : 12

matlabauc代码-NoisyNetworkReconstruction_SDDV:噪声耦合网络的仿真及其后续重构；模拟和代码

05-24

Matlab的耳语NoisyNetworkReconstruction_SDDV 噪声耦合网络的仿真及其后续重构；模拟和代码 reconstruction_network_simulation：包含用于仿真时间序列和重建算法的matlab函数（方法2p_alg ：在t <tau <（t + delta t）处的近似活动f和时间导数cdot，其中f = 0.5 *（f（t）+ f（t + delta t）和xdot = 1 / delta t * f（t + delta t）-f（t） 3p_alg ：在时间t处具有f（t + delta t）-f（t-delta t）的近似时间导数，在时间t处使用活动， nextstep_alg ：使用f（x + delta t）= A * f（x）进行重构概念验证： strawman_wo_noise模拟无噪声和有噪声的时间序列（从随机初始条件中放松一个），比较两个不同噪声水平的可重构性精度测试，比较2p_alg的重构以得到全精度，三位数后舍入并以std加上噪声（1 / 6 10 ^ -3；然后所有值的99.8％落入0.5 10 ^ -3〜四

DRCN神经网络

我の博客

02-15

4246

DRCN 深度递归卷积网络

论文阅读VideoMAE: Masked Autoencoders are Data-Efficient Learners for Self-Supervised Video Pre-Training

qq_42740834的博客

03-06

1268

为了在相对较小的数据集上实现最佳性能，通常需要对超大规模数据集上的video transformers进行预训练。在本文中，我们展示了video masked autoencoders(VideoMAE)是用于自监督视频预训练(SSVP)的数据高效学习者。我们受到最近ImageMAE[31]的启发，提出了特定的video tube masking带有极高的比例。

Video Caption Tutorial

Sundrops的专栏

04-26

1万+

欢迎star fork: video-caption.pytorch或者video-caption.pytorch 任务介绍和image caption一样，不过是将图片换成了一段视频，根据视频内容给出一句文字描述。可用于后续的视频检索或者摘要生成，帮助智能体或者有视觉障碍的人理解现实情况。 Language model-based approach 语言模型为基础的...

Video captioning——Video Analysis视频to文字描述任务

PRIS-SCMonkey的博客

02-23

3931

Vedio captioning——Video Analysis视频to文字描述任务 Vedio captioning的定义为一张图片产生一个描述被称为image caption任务,为一个视频产生一个描述成为vedio caption，但视频可以理解为在时间上有连续性的一组图片，因此可以理解成为一组图片产生一个描述。 vedio caption是属于对vedio analysis的高层语义分析...

论文阅读：CVPR2016 Paper list