1. MS COCO数据集简介
官网地址:https://cocodataset.org/
简介:MS COCO是一个非常大型且常用的数据集,其中包括了目标检测,分割,图像描述等。
2. MS COCO数据集下载
以下载coco2017数据集为例,只需要下载三个文件:
- 2017 Train images [118K/18GB]
- 2017 Val images [5K/1GB]
- 2017 Train/Val annotations [241MB]:对应训练集和验证集的标注json文件
目录结构如图:
3. MS COCO标注文件格式
3.1 使用python的json库查看annotations里的json文件
下面以读取instances_val2017.json为例:
import json
json_path = "/data/coco2017/annotations/instances_val2017.json"
json_labels = json.load(open(json_path, "r"))
print(json_labels["info"])
单步调试可以看到读入进来后是个字典的形式,包括了info、licenses、images、annotations以及categories信息:
- images是一个列表(元素个数对应图像的张数),列表中每个元素都是一个dict,对应一张图片的相关信息。包括对应图像名称、图像宽度、高度等信息。
- annotations是一个列表(元素个数对应数据集中所有标注的目标个数,注意不是图像的张数),列表中每个元素都是一个dict对应一个目标的标注信息。包括目标的分割信息(polygons多边形)、目标边界框信息[x,y,width,height](左上角x,y坐标,以及宽高)、目标面积、对应图像id以及类别id等。iscrowd参数只有0或1两种情况,一般0代表单个对象,1代表对象集合。
- categories是一个列表(元素个数对应检测目标的类别数)列表中每个元素都是一个dict对应一个类别的目标信息。包括类别id、类别名称和所属超类。
3.2 使用官方cocoAPI查看
Windows系统安装pycocotools:
pip install pycocotools-windows
然后在pycharm里调用pycocotools的工具包,可以对图像及其标注信息进行打印。
更多具体内容请参考博文:
https://blog.csdn.net/qq_37541097/article/details/113247318?spm=1001.2014.3001.5501