1.MSCOCO (Microsoft Common Objects in Context)
MSCOCO 数据集是一个大规模的目标检测、分割、关键点检测和字幕数据集。
该数据集由328K图像组成。
目标检测: 包含80个对象类别的边界框和每个实例分割掩码;
说明文字: 图像的自然语言描述;
关键点检测: 包含超过200,000张图像和250,000个标有关键点的人实例(17个可能的关键点,如左眼,鼻子,右臀部,右脚踝等)
素材图像分割-逐像素分割蒙版与91素材类别,如草,墙,天空(见MS COCO素材
全景的: 全场景分割,有80个事物类别(如人、自行车、大象)和91个事物类别的子集(草、天空、道路)
密集姿势:超过39,000张图片和56,000个人物实例被贴上了密集姿势的标签——每个被标记的人物都有一个实例id和属于该人物身体和模板3D模型的图像像素之间的映射