Celeb数据集
CelebA数据集是香港中文大学开源大规模的人脸检测基准数据集。它包含10177个名人身份的202599张人脸图片,此数据集中的图像覆盖了大的姿势变化和背景杂乱。每个图像都有40个属性注释,例如可区分是否佩戴眼镜、长短发、鼻子、嘴唇、发色、性别等特征,本文对此数据集以性别做标签,对人脸进行性别区分,其中包含女性118165张人脸图片,男性138704张人脸图片。该数据集可用作面部属性识别,面部检测,地标(或面部部分)定位以及面部编辑和合成的数据集使用。下载可前往官网上下载,或者直接在百度网盘(官方提供)上下载,数据集有一点大。
整理数据集
数据集下载之后就是一个文件夹里面包含各种人脸图片,本文主要简单介绍以下按照性别整理数据集。在Anno文件夹中包含储存图片属性的txt即如下左图所示,右边图示中202599标识的是有标记的图片的张数,红色框中是标记了的属性(有40个),绿色框中是每个属性对应的值,1表示是属于这个属性,-1表示相反属性。例如Male这个标记(第21个),在000001.jpg中值是-1,所以该人脸图像是女性。