深度学习常用数据集介绍与下载（附网盘链接）

思绪无限

已于 2022-09-27 11:12:21 修改

阅读量4.7w

点赞数 48

分类专栏：机器学习数据处理文章标签：深度学习人脸识别目标检测数据集数据分类

于 2020-09-29 13:49:10 首次发布

原创博文未经博主同意不得转载，引用请注明出处

本文链接：https://blog.csdn.net/qq_32892383/article/details/108865940

版权

机器学习同时被 2 个专栏收录

9 篇文章

订阅专栏

机器学习数据处理

5 篇文章

订阅专栏

摘要

这篇博文总结了博主收集的深度学习常用的数据集，包含常用的分类、目标检测及人脸识别任务，对每个数据集给出了简要介绍、官网下载网站以及公众号获取的关键字。因为有的数据集较大，官网的下载速度可能比较慢，为了方便大家管理，这里我将其整理到了个人公众号平台中，可通过下方卡片“AI技术研究与分享”关注，并在后台回复各数据集关键字即可获取网盘链接。数据集文件均为官方网站下载，仅用于学习交流，博主会持续更新，欢迎关注。

目录

1. 分类数据集

数据集：MNIST

数据集：CIFAR-10

数据集：Fashion-MNIST

数据集：Imagenet

2. 目标检测数据集

数据集：MS-COCO

数据集：PASCAL-VOC

数据集：BDD100K

数据集：Open-Images

3. 人脸识别数据集

数据集：CASIA-WebFace

数据集：PubFig

数据集：CelebA

数据集：ColorFeret

数据集：MTFL

数据集：FaceDB

数据集：LFW

数据集：Person identification in TV series

数据集：CMUVASC-PIE

数据集：CASIA-FaceV5

数据集：The CNBC Face Database

数据集：IMDB-WIKI

数据集：FDDB

数据集：Caltech-10K-WebFaces

数据集：JAFFE

数据集：AFLW

1. 分类数据集

数据集：MNIST

手写数字数据集，包含一组60,000个示例的训练集和一组10,000个示例的测试集。

官网地址

MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges

关键字（建议复制）

Mnist

数据集：CIFAR-10

包含了10个类别的60,000个图像（每个类在上图中表示为一行）。总共有50,000个训练图像和10,000个测试图像。

官网地址

CIFAR-10 and CIFAR-100 datasets

关键字（建议复制）

CIFAR-10

数据集：Fashion-MNIST

包含60,000个训练图像和10,000个测试图像。类似MNIST的时尚产品数据库。

官网地址

GitHub - zalandoresearch/fashion-mnist: A MNIST-like fashion product database. Benchmark

关键字（建议复制）

fashion-mnist

数据集：Imagenet

Imagenet数据集有1400多万幅图片，涵盖2万多个类别，关于图像分类、定位、检测等研究工作大多基于此数据集展开。

官网地址

http://www.image-net.org/about-stats

关键字（建议复制）

ImageNet

2. 目标检测数据集

数据集：MS-COCO

COCO是一个规模大且丰富的物体检测，分割和字幕数据集。330K图像，80个物体类别，每幅图像5个字幕，250，000个有关键点的人。

官网地址

COCO - Common Objects in Context

关键字（建议复制）

MS-COCO

数据集：PASCAL-VOC

PASCAL VOC挑战赛是视觉对象的分类识别和检测的一个基准测试，提供了检测算法和学习性能的标准图像注释数据集和标准的评估系统，包括20个目录。

官网地址

The PASCAL Visual Object Classes Homepage

关键字（建议复制）

PASCAL-VOC

数据集：BDD100K

自动驾驶常用大型多样化数据集，标注超过100,000张图像，类别包含公共汽车，行人，自行车，卡车，小汽车，火车和骑手等，用于目标检测、全帧分割等。

官网地址

Berkeley DeepDrive

关键字（建议复制）

BDD-100K

数据集：Open-Images

Open Images是一个包含近900万个图像URL的数据集。这些图像已经用数千个类别的图像级标签边框进行了注释。

官网地址

Open Images V6

关键字（建议复制）

Open-Images

3. 人脸识别数据集

数据集：CASIA-WebFace

包含了10575 个人的494414 张图像。CASIA-webface数据库，里面包含了10000个人，一共50万张人脸图片，均来源于网络。

官网地址

NameBright - Coming Soon

关键字（建议复制）

CASIA-WebFace

数据集：PubFig

哥伦比亚大学的公众人物脸部数据集，包含有200个人的58k+人脸图像，主要用于非限制场景下的人脸识别。

官网地址

Pubfig: Public Figures Face Database

关键字（建议复制）

PubFig

数据集：CelebA

香港中文大学汤晓鸥教授实验室公布的大型人脸识别数据集。该数据集包含有200K张人脸图片，人脸属性有40多种，主要用于人脸属性的识别。

官网地址

CelebA Dataset

关键字（建议复制）

CelebA

数据集：ColorFeret

包括了一个通用人脸库以及通用测试标准，它已经包含了1000多人的10000多张照片，每个人包括了不同表情，光照，姿态和年龄的照片。

官网地址

color FERET Database | NIST

关键字（建议复制）

ColorFeret

数据集：MTFL

该数据集包含了将近13000张人脸图片，均采自网络。

官网地址

Facial Landmark Detection by Deep Multi-task Learning

关键字（建议复制）

MTFL

数据集：FaceDB

包含了1521幅分辨率为384x286像素的灰度图像。每一幅图像来自于23个不同的测试人员的正面角度的人脸。

官网地址

BioID Face Database | Face Detection Dataset | facedb - BioID

关键字（建议复制）

FaceDB

数据集：LFW

为了研究非限制环境下的人脸识别问题而建立的。这个数据集包含超过13，000张人脸图像，均采集于Internet。为了研究非限制环境下的人脸识别问题而建立的。这个数据集包含超过13，000张人脸图像，均采集于Internet。

官网地址

http://vis-www.cs.umass.edu/lfw/

关键字（建议复制）

LFW

数据集：Person identification in TV series

该数据集所选用的人脸照片均来自于两部比较知名的电视剧，《吸血鬼猎人巴菲》和《生活大爆炸》。

官网地址

Semi-supervised Learning with Constraints for Person Identification in Multimedia Data

关键字（建议复制）

PITVS

数据集：CMUVASC-PIE

CMU PIE人脸库建立于2000年11月，它包括来自68个人的40000张照片，其中包括了每个人的13种姿态条件，43种光照条件和4种表情下的照片。

官网地址

http://vasc.ri.cmu.edu/idb/html/face/index.html

关键字（建议复制）

CMUVASC-PIE

数据集：CASIA-FaceV5

该数据集包含了来自500个人的2500张亚洲人脸图片。

官网地址

关键字（建议复制）

CASIA-FaceV5

数据集：The CNBC Face Database

该数据集采集了200个人在不同状态下（不同的神情，装扮，发型等）的人脸照片。

官网地址

http://wiki.cnbc.cmu.edu/Face_Place

关键字（建议复制）

Face-Place

数据集：IMDB-WIKI

IMDB-WIKI人脸数据库总共523,051张人脸数据库，每张图片都被标注了人的年龄和性别，对于年龄识别和性别识别的研究有着重要的意义。

官网地址

IMDB-WIKI - 500k+ face images with age and gender labels

关键字（建议复制）

IMDB-WIKI

数据集：FDDB

FDDB是UMass的数据集，被用来做人脸检测(Face Detection)。这个数据集比较大，比较有挑战性。

官网地址

http://vis-www.cs.umass.edu/fddb/index.html

关键字（建议复制）

FDDB

数据集：Caltech-10K-WebFaces

10k+人脸，提供双眼和嘴巴的坐标位置

官网地址

http://www.vision.caltech.edu/Image_Datasets/Caltech_10K_WebFaces/#Description

关键字（建议复制）

Caltech-10K

数据集：JAFFE

该数据库是由10位日本女性在实验环境下根据指示做出各种表情。整个数据库一共有213张图像，10个人，全部都是女性，每个人做出7种表情。

官网地址

The Japanese Female Facial Expression (JAFFE) Dataset | Zenodo

关键字（建议复制）

JAFFE

数据集：AFLW

前2000个AFLW样本的拟合3D面，可用于3D面对齐评估。

官网地址

http://www.cbsr.ia.ac.cn/users/xiangyuzhu/projects/3DDFA/main.htm

关键字（建议复制）

AFLW

数据集文件均为官方网站下载，仅用于学习交流，博主会持续更新，欢迎关注。

更多分享，敬请期待！

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

思绪无限 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。