CVPR2017 paper: A Hierarchical Approach for Generating Descriptive Image Paragraphs复现

最新推荐文章于 2022-12-27 19:56:19 发布

独孤的大山猫

最新推荐文章于 2022-12-27 19:56:19 发布

阅读量970

点赞数

分类专栏： Deep learning environment 文章标签： CVPR2017 paper 李飞飞 CVPR2017 paper复现李飞飞字幕论文复现 A Hierarchical Approach for Ge

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiqi4145/article/details/95605252

版权

Deep learning environment 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

此文仅当做给实验室大三学弟的笔记

论文地址:https://arxiv.org/abs/1611.06607

代码地址：https://github.com/InnerPeace-Wu/im2p-tensorflow

step1: 这里我建立了一个项目名字叫VG, 把训练数据，测试数据，源代码，输出结果都放在了VG目录下，方便管理。

下载好的代码，解压到VG中如下：

step2:然后去官网 http://visualgenome.org/api/v0/api_home.html 下载数据集，下完大概不到20G，然后载VG目录下建立images文件夹，然后将下好的数据集解压到images目录里面，如下图：

创建目录images:

解压下载好后的label:

有了代码和数据集，现在我们开始配置环境：

需要用到的package都载 requirements.txt里面，主要包括：

安装完这些包和库之后(如果安装有问题，可以留言) ,还需要安装一个java运行环境，因为用到了json和html网页相关的技术，使用命令：

sudo apt-get install openjdk-8-jre

安装即可

配置好训练和测试所需要的基本环境后，如果只想跑demo不训练的话：

进入到 VG/lib 文件夹，如下

然后执行 make ，编译完成后，就有了我们需要的依赖库了。

然后在VG下建一个data文件夹，用于存放待测试的图片，一个output文件夹，用于存放从这里https://drive.google.com/file/d/1yoJGXXpeSpQbU-6WpLsMXFLIka7xpTAy/view?usp=sharing 下载下来的模型，用于测试用的，如下图：

output下存放的文件如下：

然后在data下建立一个demo文件夹，放入你要测试的图片，demo文件夹下的待测试图片如下：

然后在VG/vis 目录下建立一个data文件夹，下面新建一个名叫 results.json的文件，用于存放输出的paragraph，结合html显示用.

然后在VG目录下执行：

bash scripts/dense_cap_demo.sh ./output/ckpt ./output/ckpt/vocabulary.txt

大概等30秒模型加载和前向计算后，在vis下会生成一个view_results.html文件，用于显示结果，点开后如下：

这是待测试图片：

这是输出结果：

可以看到输出结果对图片做了一个基本的文字描述。

注：认真看Readme和google都能解决，花了一个小时复现了下，当做给学弟的笔记, 训练自己的数据同理，只是路径修改一下。

独孤的大山猫

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

独孤的大山猫 CSDN认证博客专家 CSDN认证企业博客

码龄8年

小米科技有限责任公司

156: 原创

3万+: 周排名

50万+: 总排名

62万+: 访问

: 等级

5412: 积分

162: 粉丝

678: 获赞

299: 评论

1920: 收藏

私信

关注

热门文章

分类专栏

最新评论

如何解决 RecursionError: maximum recursion depth exceeded
歇.: .spec文件在哪里啊
Check failed: status == CUDNN_STATUS_SUCCESS(4 vs. 0) 等总结
2401_85472560: System check SUCCESS !! Use Power key to exit.
cuda和cudatoolkit
weixin_51499512: 哥，我在切换不同版本cuda跑代码的时候报了这个错，感觉跟您讲的东西挺接近的，您遇到过类似的问题不，知道的话能否帮我解决一下，万分感谢[抱拳][抱拳]。 File "/root/miniconda3/envs/vim/lib/python3.10/site-packages/triton/compiler/compiler.py", line 425, in compile so_path = make_stub(name, signature, constants) File "/root/miniconda3/envs/vim/lib/python3.10/site-packages/triton/compiler/make_launcher.py", line 39, in make_stub so = _build(name, src_path, tmpdir) File "/root/miniconda3/envs/vim/lib/python3.10/site-packages/triton/common/build.py", line 61, in _build cuda_lib_dirs = libcuda_dirs() File "/root/miniconda3/envs/vim/lib/python3.10/site-packages/triton/common/build.py", line 30, in libcuda_dirs assert any(os.path.exists(os.path.join(path, 'libcuda.so')) for path in dirs), msg AssertionError: libcuda.so cannot found! Possible files are located at ['/lib/x86_64-linux-gnu/libcuda.so.1'].Please create a symlink of libcuda.so to any of the file. Process finished with exit code 1
DLL load failed while importing _imaging
qq_40277555: 解决了吗我的是py3.9.18，pillow=9.3.0 也是报错了
台式机和笔记本的cv2.VideoCapture(0)和cv2.VideoCapture(1)区别
2301_80296115: 你好，请问笔记本调用外带的USB工业摄像头可以用cv2.VideoCapture的方法吗

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。