计算机视觉常用数据集总结:包括MS COCO、ImageNet、VOC、人脸识别、行人检测等

本文总结了计算机视觉领域的重要数据集,包括PASCAL VOC、ImageNet和COCO,以及人脸识别和行人检测的数据集。PASCAL VOC作为鼻祖,ImageNet以其大规模而知名,COCO则提供了丰富的物体检测和分割资源。此外,还介绍了几个典型的人脸识别数据集和行人检测数据库。
摘要由CSDN通过智能技术生成

本篇博文主要对目前公开的计算机视觉常用数据集进行总结。

1.PASCAL VOC(权威鼻祖)

PASCAL VOC是一个图像集,由Mark Everingham (University ofLeeds)、Luc van Gool (ETHZ, Zurich)等人创立,有1.7W+张图片,分为20类。PASCALVOC竞赛也是计算机视觉竞赛的鼻祖,从2005年到2012年一共举办了8届,包含了物体分类(Classification)、目标检测(Detection)、图像分割(Segmentation)、Person Layout等任务,后来逐渐被ILSVRC竞赛替代。
在这里插入图片描述
下载地址:http://host.robots.ox.ac.uk/pascal/VOC/

百度云下载:VOC2007 train_val_test & VOC2012 train_val
提取码:jz27


2. ImageNet数据集

ImageNet是一个图像集,由斯坦福大学李飞飞创立,有1400W+张样例图片,分为27大类和2W+小类,只能用于非商业研究和教学使用。与ImageNet图像集相应的是著名的ILSVRC竞赛,各种新机器学习算法脱颖而出(AlexNet、ZFNet、GoogleNet、ResNet、…),图像识别率得以显著提高,在ILSVRC竞赛上一举成名是近几年来计算机视觉从业者的梦想。

在这里插入图片描述
下载地址:http://www.image-net.org/download-imageurls


3. COCO数据集

官网: http://cocodataset.org

MS COCO的全称是Microsoft Common Objects in Context,起源于微软于2014年出资标注的Microsoft COCO数据集,与ImageNet竞赛一样,被视为是计算机视觉领域最受关注和最权威的比赛之一。

COCO数据集是一个大型的、丰富的物体检测,分割和字幕数据集。这个数据集以scene understanding为目标,主要从复杂的日常场景中截取,图像中的目标通过精确的segmentation进行位置的标定。图像包括91类目标,328,000影像和2,500,000个label。目前为止有语义分割的最大数据集,提供的类别有80 类,有超过33 万张图片,其中20 万张有标注,整个数据集中个体的数目超过150 万个。

数据集下载地址

Images:

2014 Train images [83K/13GB]
2014 Val images [41K/6GB]
2014

  • 10
    点赞
  • 60
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值