{
"sent_ids": [ # 句子id,显然这里有两个句子
142197,
142198
],
"file_name": "COCO_train2014_000000000110_7.jpg", # 对应图片文件序号,根据此序号可以找到对应coco数据集中的图片,最后的7唯一代表图片中的对象
"ann_id": 1220393, # 对应annotaions的id
"ref_id": 49995, # 这个应该对应此结构信息本身的id
"image_id": 110, # 对应图片序号
"split": "train", # 当前数据用于训练
"sentences": [ # 以下内容是句子的,单词,原始句子,句子id和格式化后句子
{
"tokens": ["girl", "on", "left"],
"raw": "girl on left",
"sent_id": 142197,
"sent": "girl on left"
},
{
"tokens": ["little", "girl", "on", "left"],
"raw": "little girl on left",
"sent_id": 142198,
"sent": "little girl on left"
}
],
"category_id": 1 # 代表描述对象类别,1代表人
}
读取到的文件中包含了大量类似上面内容的结构。根据键很容易理解对应存储的数据。