数据集名称 | 数据集简介(包含用途、用法、字段含义等) | 数据集文件名称或下载链接 | 类别(公共或自研) | 领域(非必填) |
Mnist手写数字 | 识别数字0-9,包含60000的训练集和10000的测试集 | http://yann.lecun.com/exdb/mnist/ | 公共 | 计算机视觉 |
MS-COCO | 微软发布的 COCO 数据库是一个大型图像数据集, 专为对象检测、分割、人体关键点检测、语义分割和字幕生成而设计,Label使用Json文件存储。大小:25 GB(压缩) | http://mscoco.org/ | 公共 | 计算机视觉 |
ImageNet | ImageNet是根据WordNet(英语字典)层次结构组织的图像数据集。WordNet包含大约100000个单词,ImageNet平均提供了大约1000个图像来说明每个单词。总图像是大约是1,500,000,每个都有多个边界框和相应的类标签。大小:150GB | http://www.image-net.org/ | 公共 | 计算机视觉 |
CIFAR | CIFAR-10包含10个类别,50000个训练图像,10000个测试图像。CIFAR-100与CIFAR-10类似,包含100个类,每类有600张图片,其中500张用于训练,100张用于测试,图像类别均有明确标注。CIFAR对于图像分类算法测试来说是一个非常不错的中小规模数据集。 | http://www.cs.toronto.edu/~kriz/cifar.html | 公共 | 计算机视觉 |
Visual QA | VQA是一个包含相关图像的开放式问题的数据集,包含265016张图片,每张图片至少有3个问题和10个基本事实答案。 | https://visualqa.org/ | 公共 | 计算机视觉 |
Google-Landmark | 地标检测,该数据集包含200万多幅图像,描绘了来自世界各地的3万处独特的地标。 | https://github.com/cvdfoundation/google-landmark | 公共 | 计算机视觉 |
人脸识别LFW数据集 | 该数据集是为了研究非限制环境下的人脸识别问题而建立。这个集合包含超过13000张人脸图像,每个人脸被标注了一个人名。 其中,大约1680个人包含两个以上的人脸。 | https://pan.baidu.com/s/12O5OfTh5H1Hhz81t8KQI8A 密码:msc3 | 公共 | 计算机视觉 |
人脸检测300-W | 300-W数据集采用了半监督的标注工具,将AFLW,AFW,Helen,IBUG,LFPW,FRGC-V2,XM2VTS等数据集进行了统一标注后得到的。该数据集标注了68个人脸特征关键点信息。 | https://ibug.doc.ic.ac.uk/resources/300-W/ | 公共 | 计算机视觉 |
年龄性别IMDB-wiki数据集 | IMDB-WIKI人脸数据库是由IMDB数据库和Wikipedia数据库组成,其中IMDB人脸数据库包含了460723张人脸图片,而Wikipedia人脸数据库包含了62328张人脸数据库,总共523051张人脸数据。这是目前年龄和性别识别最大的数据集。 | https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/ | 公共 | 计算机视觉 |
计算机视觉数据集收集
最新推荐文章于 2024-04-01 16:15:38 发布