计算机视觉常用数据集总结：包括MS COCO、ImageNet、VOC、人脸识别、行人检测等

最新推荐文章于 2024-08-01 14:23:27 发布

置顶

Mr.Jk.Zhang

最新推荐文章于 2024-08-01 14:23:27 发布

阅读量7.7k

点赞数 10

分类专栏：计算机视觉

本文链接：https://blog.csdn.net/mrjkzhangma/article/details/100161751

版权

本文总结了计算机视觉领域的重要数据集，包括PASCAL VOC、ImageNet和COCO，以及人脸识别和行人检测的数据集。PASCAL VOC作为鼻祖，ImageNet以其大规模而知名，COCO则提供了丰富的物体检测和分割资源。此外，还介绍了几个典型的人脸识别数据集和行人检测数据库。

摘要由CSDN通过智能技术生成

本篇博文主要对目前公开的计算机视觉常用数据集进行总结。

1.PASCAL VOC（权威鼻祖）

PASCAL VOC是一个图像集，由Mark Everingham (University ofLeeds)、Luc van Gool (ETHZ, Zurich)等人创立，有1.7W+张图片，分为20类。PASCALVOC竞赛也是计算机视觉竞赛的鼻祖，从2005年到2012年一共举办了8届，包含了物体分类（Classification）、目标检测（Detection）、图像分割（Segmentation）、Person Layout等任务，后来逐渐被ILSVRC竞赛替代。
在这里插入图片描述
下载地址：http://host.robots.ox.ac.uk/pascal/VOC/

百度云下载：VOC2007 train_val_test & VOC2012 train_val
提取码：jz27

2. ImageNet数据集

ImageNet是一个图像集，由斯坦福大学李飞飞创立，有1400W+张样例图片，分为27大类和2W+小类，只能用于非商业研究和教学使用。与ImageNet图像集相应的是著名的ILSVRC竞赛，各种新机器学习算法脱颖而出（AlexNet、ZFNet、GoogleNet、ResNet、…），图像识别率得以显著提高，在ILSVRC竞赛上一举成名是近几年来计算机视觉从业者的梦想。

在这里插入图片描述
下载地址：http://www.image-net.org/download-imageurls

3. COCO数据集

官网: http://cocodataset.org

MS COCO的全称是Microsoft Common Objects in Context，起源于微软于2014年出资标注的Microsoft COCO数据集，与ImageNet竞赛一样，被视为是计算机视觉领域最受关注和最权威的比赛之一。

COCO数据集是一个大型的、丰富的物体检测，分割和字幕数据集。这个数据集以scene understanding为目标，主要从复杂的日常场景中截取，图像中的目标通过精确的segmentation进行位置的标定。图像包括91类目标，328,000影像和2,500,000个label。目前为止有语义分割的最大数据集，提供的类别有80 类，有超过33 万张图片，其中20 万张有标注，整个数据集中个体的数目超过150 万个。

数据集下载地址

Images:

2014 Train images [83K/13GB]
2014 Val images [41K/6GB]
2014