refcoco数据集中，refs(unc).p文件内容格式

errorwarn

已于 2024-02-20 16:54:52 修改

阅读量1.4k

点赞数 4

文章标签： json 深度学习计算机视觉

于 2024-02-20 16:35:07 首次发布

本文链接：https://blog.csdn.net/errorworn/article/details/136193428

版权

{
  "sent_ids": [  # 句子id，显然这里有两个句子

    142197,

    142198

  ],

  "file_name": "COCO_train2014_000000000110_7.jpg",  # 对应图片文件序号，根据此序号可以找到对应coco数据集中的图片，最后的7唯一代表图片中的对象

  "ann_id": 1220393,  # 对应annotaions的id

  "ref_id": 49995,  # 这个应该对应此结构信息本身的id

  "image_id": 110,  # 对应图片序号

  "split": "train",  # 当前数据用于训练

  "sentences": [  # 以下内容是句子的，单词，原始句子，句子id和格式化后句子

    {

      "tokens": ["girl", "on", "left"],

      "raw": "girl on left",

      "sent_id": 142197,

      "sent": "girl on left"

    },

    {

      "tokens": ["little", "girl", "on", "left"],

      "raw": "little girl on left",

      "sent_id": 142198,

      "sent": "little girl on left"

    }

  ],

  "category_id": 1  # 代表描述对象类别，1代表人

}

读取到的文件中包含了大量类似上面内容的结构。根据键很容易理解对应存储的数据。