编写不易如果觉得不错,麻烦关注一下~
不知道扩展vg relation 种类数,现在市面上都是VG150的身影了....
但是检测的种类又那么多,尝试扩展微软模块neural motif 谓词种类数量......
注意一点!glove 应该是没有词组,所以会转换成词组其中的一个词,所以自己还需要筛选或者转换成别的词
一、数据集配料:(利用下面三个主食)108,077 Images
看一下三个文件一一对应关系:
1. image_data.json 可以看出visualgenome 10万多的图片是从1 开始排序,但是后来发现第5000断层,后来发现不能只使用obj_id 而是要自己内部排序,需要对boxlist 进行内部从0编码id。
2.object.json
里面有重要的目标的编号id,name,宽高,x,y坐标。我们下面使用xyxy模式,也即x2 = x+w, y2 = y+h ,同样这里也是从图片1号开始编码
3.relationship.json
一个图的关系很丰富呀,这么多。一个图的关系组成relationships 的一个列表元素。重要元素,目标id, predicate 名称, 目标的名称
4. 可视化该图一个关系,标框验证一一对应关系
找出对应的object_id 之间的关系
man:1058532, jacket 1058530 之间为has 关系
参考之前我的文章https://blog.csdn.net/u012211422/article/details/115722417?spm=1001.2014.3001.5501
二、准备成微软需要的数据集tsv格式
由于官网已经提供了img.tsv 于hw.tsv 所以我们只需要提供label.tsv以及linelist.tsv
至于如何制作这两个数据文件,可以参考上面的分析以及之前我的一篇文章编写即可。
https://blog.csdn.net/u012211422/article/details/117733173?spm=1001.2014.3001.5501
格式如下:
成功生成文件