MS COCO数据集下载与查看

1. MS COCO数据集简介

官网地址:https://cocodataset.org/
简介:MS COCO是一个非常大型且常用的数据集,其中包括了目标检测,分割,图像描述等。

2. MS COCO数据集下载

以下载coco2017数据集为例,只需要下载三个文件:

  • 2017 Train images [118K/18GB]
  • 2017 Val images [5K/1GB]
  • 2017 Train/Val annotations [241MB]:对应训练集和验证集的标注json文件
    目录结构如图:
    目录结构
3. MS COCO标注文件格式
3.1 使用python的json库查看annotations里的json文件

下面以读取instances_val2017.json为例:

import json

json_path = "/data/coco2017/annotations/instances_val2017.json"
json_labels = json.load(open(json_path, "r")) 
print(json_labels["info"])

单步调试可以看到读入进来后是个字典的形式,包括了info、licenses、images、annotations以及categories信息:

  • images是一个列表(元素个数对应图像的张数),列表中每个元素都是一个dict,对应一张图片的相关信息。包括对应图像名称、图像宽度、高度等信息。
  • annotations是一个列表(元素个数对应数据集中所有标注的目标个数,注意不是图像的张数),列表中每个元素都是一个dict对应一个目标的标注信息。包括目标的分割信息(polygons多边形)、目标边界框信息[x,y,width,height](左上角x,y坐标,以及宽高)、目标面积、对应图像id以及类别id等。iscrowd参数只有0或1两种情况,一般0代表单个对象,1代表对象集合。
  • categories是一个列表(元素个数对应检测目标的类别数)列表中每个元素都是一个dict对应一个类别的目标信息。包括类别id、类别名称和所属超类。
3.2 使用官方cocoAPI查看

Windows系统安装pycocotools:

pip install pycocotools-windows

然后在pycharm里调用pycocotools的工具包,可以对图像及其标注信息进行打印。
更多具体内容请参考博文:
https://blog.csdn.net/qq_37541097/article/details/113247318?spm=1001.2014.3001.5501

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值