研究YOLO系列
COCO数据集
coco数据集是一个大型的物体检测、分割和字幕数据集
COCO数据集是一个大型的、丰富的物体检测,分割和字幕数据集。这个数据集以scene understanding为目标,主要从复杂的日常场景中截取,图像中的目标通过精确的segmentation进行位置的标定。图像包括91类目标,328,000影像和2,500,000个label。目前为止有语义分割的最大数据集,提供的类别有80 类,有超过33 万张图片,其中20 万张有标注,整个数据集中个体的数目超过150 万个。这就是YOLOV3采用的数据集。
该数据集主要解决3个问题:目标检测,目标之间的上下文关系,目标的2维上的精确定位。COCO数据集有91类,虽然比ImageNet和SUN类别少,但是每一类的图像多,这有利于获得更多的每类中位于某种特定场景的能力,对比PASCAL VOC,其有更多类和图像。
目标检测任务(object Detection Task)框和实例分割(人、球拍)
Stuff Segmentation Task 草地、沙分割
Panoptic Segmentation Task 实景分割
Captioning Challenge 看图说话