1. 前言
最近用到 COCO2017 数据集做目标检测,顺便整理一下数据集。
COCO 数据集用专门的 python api 方便直接来读取图片数据,详细可看 https://github.com/cocodataset/cocoapi,
这里主要是统计数据集的类别,这样就清楚自己的训练数据是否足够,不同的类别分布是否均衡等问题。
2. COCO 类别编号及名称
COCO2017 数据集共 80 小类,类别 id 号不连续,最大为 90,各类别 id 与类别名称对应关系如下:
3. 类别数量统计代码
使用以下代码来统计类别、图片数、标注框数:
from pycocotools.coco import COCO
dataDir='./COCO'
dataType='val2017'
#dataType='train2017'
annFile='{}/annotations/instances_{}.json'.format(dataDir, dataType)
# initialize COCO api for instance annotations
coco=COCO(annFile