本文旨在对当下活体检测研究领域的公开数据集进行整理
如有不全面的地方请留言补充
文章目录
公开数据集分类
1. 早期公开数据集
- 有限的样本分布变化,光线、人物ID少
- 场景基本都在室内
- 攻击类型仅包括:打印纸(Print)和屏幕翻拍(Replay)
1.1 NUAA
- 发布于2010年,是一个Replay攻击人脸数据集,包含15个人采集的照片。
- 采集时使用20fps,对每一个正面人脸姿态和中性表情进行采集,每一个人采集500张图,分辨率大小为640×480
- 人脸图像采集使用了Canon相机,而伪造人脸则使用相机纸打印和A4纸打印
1.2 YALE Recaptured(需联系作者获取)
- 数据集发布于2011年,由640张真脸和1920张LCD屏幕翻拍数据构成
- 翻拍数据来自于Yale Face Database B数据集。
- LCD屏幕的类型:LG Flatron L196WTQ Wide 19,CTL 171Lx 17 ‘’ TFT,DELL Inspiron 1545 notebook
- 相机型号:Kodak C813 8.2 megapixel,Samsung Omnia i900
- 照片为灰度图,脸部位于图像中心,分辨率为64 x 64
1.3 REPLAY-ATTACK(需申请)
- 发布于2012年,这是一个Replay攻击人脸数据集,包含50个人的1300个视频。
- 图片分辨率为320×240像素,基于拍摄多种光线条件下拍摄。
1.4 MSU-MFSD (需申请)
- 仅开源部分子集
- 280个图片和视频攻击,35个人
2. 大规模数据库
- 数据量庞大
2.1 Celeb-Spoof
参考论文 数据下载
大规模:包含10177个ID,总共625537张图像,远超其他数据集
多样性:图像拍摄于8个场景(2个环境 x 4种光线),由10个以上镜头拍摄
标注丰富:10种不同标签信息标注
3. 多样化数据分布
- 样本分布变化多样化
- 包含室内及室外场景
- 多个光线条件
- 攻击类型丰富,包含新的细致攻击类别
3.1 HiFiMask(需申请)
- 世界上最大的3D Mask活体攻击数据集,包含54600视频,75个采集对象(25黄种人、25白种人、25黑种人)
- 每个拍摄对象采集3种不同的3D Mask攻击类型(透明、石膏、树脂),高度逼真还原真脸
- 6种复杂场景(白色光、绿色光、周期变换的3种光线、室外强光、室外阴影、运动模糊等),其中周期变换的光线采用[0.7, 4]Hz模拟人体脉搏跳动。
- 同一个场地拍摄6个视频,分别采用不同光照(正常、强光、背光、侧光、昏暗)
- 使用高清拍摄设备保障视频分辨率(iPhone11, iPhoneX, MI10, P40, S20, Vivo, HJIM)
3.2 SiW (需申请)
- 发布于2016年,这是一个活体检测数据集,包含165个人,每个人包含8段真实的视频,多达20段伪造的视频,总共4478个视频。视频的分辨率为1080p,帧率是30fps。
4. 多模态数据集
- 包含多模态数据
- NIR、深度图、Thermal、SWIR、Light Field Camera
4.1 WMCA (需申请)
- 数据集由1941个短视频构成。包含72个采集对象,多个模态数据:彩色、深度图、近红外图、热红外。
4.2 HQ-WMCA (需申请)
- 数据集由2904个多模态短视频构成,包括真人及活体攻击样本。(555活体视频来自51个采集对象;2349个活体攻击视频)
- 数据类型包括:彩色、深度图、热红外、近红外、短波红外
4.3 CASIA-Surf
- 发布于2019年,这是一个活体检测数据集,包括1000个人的21000个视频。
- 数据集通过Intel RealSense SR 300相机在不同的室内背景下采集得到,同时采集RGB、Depth和IR视频。
- 其中RGB图片分辨率1280×720,Depth和IR的分辨率为640×480。
4.4 CASIA-SURF CeFA
- 最新CASIA-SURF跨种族面部反欺骗(CeFA)数据集(简称为CeFA),涵盖1,607 个主题,2D+3D攻击类型。
- CeFA是第一个数据集,其中包括当前已发布/发行的用于面部防欺骗的数据集中的明显种族标签。每个sample都有depth、RGB、IR三个模态。
4.5 3DMAD(需申请)
- 发布于2013年,包含了17个人的76500张图片,使用Kinect进行采集。
- 每一个人采集了3组视频,前两组为真实视频,第三组掩码攻击图。
- 每一组视频包含了5个视频,每一个视频300帧,每个帧包括一幅深度图像、相应的RGB图像和手动标注的眼睛位置。
- 其中每帧分辨率是640×480,包含8位rgb图像和11位深度图像,采集者姿态是正面,无表情。
5. 其他开源数据集
5.1 Replay Mobile (需申请)
- 共1190个照片和视频攻击,40个人,5种不同光照条件。
- 拍摄设备: iPad Mini2 (running iOS) and a LG-G4 smartphone (running Android)
- 分辨率720x1280, 25fps, 大小15G
5.2 Msspoof (需申请)
- 自然光和近红外拍色,分辨率1280x1024,在NIR中记录图像时,相机上安装了800nm的近红外滤光片。
- 紫外和近红外图像,包含了21个人体。对于每个人,在7种情境(1走廊6办公室)下,各5张VIS,5张NIR,共(5+5)*7=70张
- 对每个人,各选3张VIS和3张NIR进行黑/白打印,并在3种光照条件下各进行4次攻击,共624*3=144张。
PS: 数据集目前可能不是很全面,部分数据集由于下载链接已经失效,没有整理
后续会继续整理,希望有相关资料的朋友可以评论留言,我会及时更新上去