数据集:PASCAL VOC,ImageNet,MS COCO等数据集。
PASCAL VOC数据集:包含约10,000张带有边界框的图片用于训练和验证。含有20个类别。具体包括
- Person: person
- Animal: bird, cat, cow, dog, horse, sheep
- Vehicle: aeroplane, bicycle, boat, bus, car, motorbike, train
- Indoor: bottle, chair, dining table, potted plant, sofa, tv/monitor
注:由于类别仅20个,因此被看成目标检测方向的一个基准数据集
VOC数据集介绍以及下载链接:http://host.robots.ox.ac.uk/pascal/VOC/
ImageNet数据集:是一个计算机视觉系统识别项目,是目前世界上图像识别最大的数据库,是美国斯坦福的计算机科学家,模拟人类的识别系统建立的。ImageNet数据集是按照WordNet架构组织的大规模带标签图像数据集。大约1500万张图片,2.2万类,每张都经过严格的人工筛选与标记。ImageNet类似于图片所有引擎。
其中,包括边界框的目标检测数据集,训练数据集包括500,000张图片,属于200类物体。由于数据集太大,训练所需计算量很大;类别数较多;造成了很少使用和目标检测的难度也很大。
ImageNet数据集介绍以及下载链接: