不知道扩展vg relation 种类数

最新推荐文章于 2022-10-12 12:00:00 发布

咪咕班克斯

最新推荐文章于 2022-10-12 12:00:00 发布

阅读量233

点赞数 1

分类专栏： pytorch github优秀代码分享

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012211422/article/details/117818426

版权

Visual Genome 谓词扩展数据集转换微软NeuralMotif tsv格式

关键词由CSDN通过智能技术生成

pytorch 同时被 2 个专栏收录

45 篇文章 5 订阅

订阅专栏

github优秀代码分享

31 篇文章 3 订阅

订阅专栏

编写不易如果觉得不错，麻烦关注一下~

不知道扩展vg relation 种类数，现在市面上都是VG150的身影了....

但是检测的种类又那么多，尝试扩展微软模块neural motif 谓词种类数量......

注意一点！glove 应该是没有词组，所以会转换成词组其中的一个词，所以自己还需要筛选或者转换成别的词

一、数据集配料：（利用下面三个主食）108,077 Images

看一下三个文件一一对应关系：

1. image_data.json 可以看出visualgenome 10万多的图片是从1 开始排序,但是后来发现第5000断层,后来发现不能只使用obj_id 而是要自己内部排序，需要对boxlist 进行内部从0编码id。

2.object.json

里面有重要的目标的编号id，name,宽高，x,y坐标。我们下面使用xyxy模式，也即x2 = x+w, y2 = y+h ,同样这里也是从图片1号开始编码

3.relationship.json

一个图的关系很丰富呀，这么多。一个图的关系组成relationships 的一个列表元素。重要元素，目标id， predicate 名称，目标的名称

4. 可视化该图一个关系，标框验证一一对应关系

找出对应的object_id 之间的关系

man:1058532, jacket 1058530 之间为has 关系

参考之前我的文章https://blog.csdn.net/u012211422/article/details/115722417?spm=1001.2014.3001.5501

二、准备成微软需要的数据集tsv格式

由于官网已经提供了img.tsv 于hw.tsv 所以我们只需要提供label.tsv以及linelist.tsv

至于如何制作这两个数据文件，可以参考上面的分析以及之前我的一篇文章编写即可。

https://blog.csdn.net/u012211422/article/details/117733173?spm=1001.2014.3001.5501

格式如下：

成功生成文件

三、修改微软输出端维度，调通代码

咪咕班克斯

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
不知道扩展vg relation 种类数

不知道扩展vg relation 种类数，现在市面上都是VG150的身影了....但是检测的种类又那么多，尝试扩展微软模块neural motif 谓词种类数量......
复制链接

扫一扫

专栏目录

咪咕班克斯 CSDN认证博客专家 CSDN认证企业博客

码龄11年

96: 原创

1万+: 周排名

229万+: 总排名

12万+: 访问

: 等级

1866: 积分

5422: 粉丝

176: 获赞

104: 评论

284: 收藏

私信

关注

热门文章

分类专栏

最新评论

ViT 家族的大杂烩（An Image is worth 16×16 Words）
m0_74827078: 博主可以给我讲讲regionvit架构的详细实现过程吗
GQA 的简单介绍
咪咕班克斯: 我感觉就是精准率ap，每个问题1个正确答案。看答对多少道题的比例。其他的评价指标没有细看
GQA 的简单介绍
ㄖ落看汐陽: 前辈，我有注意到您之前介绍GQA数据集的一篇博客，对于它的评价指标有很多，在一些论文里我也看到了这些评价指标，请问您知道应该如何具体的计算它们嘛
尝试GraphVQA的优化器及初探VinVL
TSTANGRONG: 您好！这里面pretrained_model/vinvl_vg_x152c4.pth的怎么拿到的呢
PCA主成分分析---降维（python调用实现）
咪咕班克斯: 已经好久了，我感觉是降维后的特征，比如300*100，300个特征，100维的特征长度。降为300*4，还是300个特征，但是维度降低为4。这里的reduce_x 就是300*4

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。