人脸处理常用数据集

摘抄总结自《深度学习之人脸图像处理:核心算法与案例实战》,作者言有三,侵权删。

一.通用人脸检测数据集**

1.Caltech 10000 Web Faces数据集
地址:Caltech 10000 Web Faces数据集

是一个灰度人脸数据集,包含7092张图像,10 524张⼈脸图像,平均分辨率在304×312。

2.AFW数据集

官网链接已失效

是人脸关键点检测非常早期使用的数据集,共包含205张图像473张标记的人脸图像

3.FDDB(Face Detection Data set and Benchmark)数据集

地址:FDDB(Face Detection Data set and Benchmark)数据集

是被广泛用于⼈脸检测方法评测的⼀个数据集,共2845张图像,5171张人脸图像

为了研究⽆约束⼈脸检测
采⽤椭圆标记法,可以适应⼈脸的轮廓

4.Wider-face数据集

地址Wider-face数据集

总共有32 203张图像,393 703张⼈脸

在面部的尺寸、姿势、遮挡、表情、妆容、光照上都有很⼤的变化,算法不仅标注了框,还提供了遮挡和姿态的信息
⼴泛应⽤于评估性能⽐传统⽅法更强⼤的卷积神经⽹络
图像分辨率较⾼,所有图像的宽都缩放到1024像素,最⼩标注的⼈脸⼤⼩为10×10,平均⼀张图超过10个⼈脸,密集分布的⼩⼈脸图像⾮常多。其训练集、验证集、测试集分别占40%、10%、50%,测试集⾮常⼤,结果可靠性⾼

5.MALF数据集

地址MALF数据集

包含5250张图像、11 931张⼈脸图像。

更加细粒度地评估野外环境中⼈脸检测模型
每⼀张图像都包含正⽅形边界框,头部姿态的俯仰程度包括⼩、中、⼤3个等级的标注。该数据集忽略了⼩于20×20或者⾮常难以检测的⼈脸(⼤约838张⼈脸图像),占该数据集的7%。同时还提供了性别,是否戴眼镜、是否遮挡、是否是夸张的表情等辅助信息。

二. 复杂⼈脸检测数据集

1.MAFA数据集

地址MAFA数据集

是⼀个遮挡⼈脸检测数据集,总共有30 811张图像、35 806张被遮挡的⼈脸图像,包含各种⽅向和尺度的遮挡。

2.UFDD(Unconstrained Face Detection Dataset)数据集

地址UFDD(Unconstrained Face Detection Dataset)数据集

是⼀个⾮限制场景下的⼈脸检测数据集,总共包含6425张图像、10 897张⼈脸图像

包含⾬天(Rain)、雪天 (Snow)、雾天(Haze)、模糊(Blur)、光照(Illumination)、晶体障碍(Lens impediments)和⼲扰物(Distractors)7个场景

三.关键点检测数据集

1.XM2VTS数据集

地址XM2VTS数据集

包含295张⼈脸图像、2360张正⾯的⼈脸图像,标注了68个关键点,⼤部分图像是⽆表情的,且是在同样的光照环境下

2.AR⼈脸数据库

地址AR⼈脸数据库

包括126张⼈脸图像,超过4000张图像,标注了22个关键点

3.FRVC-V2⼈脸数据库

地址FRVC-V2⼈脸数据库

共466张⼈脸图像,有4950张图像,包括均匀的光照条件下的⾼质量图像和不均匀的光照条件下的低质量图像,标注了5个关键点

4.LFPW⼈脸数据库

地址LFPW⼈脸数据库

包括1432张图像,标注了29个关键点

5.Helen⼈脸数据库

地址Helen⼈脸数据库

包括训练集和测试集,测试集包含330张⼈脸图像,训练集包括2000张⼈脸图像,都被标注了194个特征点

6.IBUG⼈脸数据库

地址IBUG⼈脸数据库

是随着300W⼀起发布的数据集,包含135张⼈脸图像,每张⼈脸图像被标注了68 个特征点

7.AFLW(Annotated Facial Landmarks in the Wild)数据集
地址AFLW(Annotated Facial Landmarks in the Wild)数据集

是⼀个包括多姿态、多视⻆的⼤规模⼈脸数据库,⼀般⽤于评估⾯部关键点检测效果,总共有21 997张图像,2593张⾯孔,每张⼈脸标注了21个关键点,共3.8×105个关键点,由于是肉眼标记,不可见的关键点不进⾏标注

⼤部分图像是彩⾊图,也有少部分是灰度图,其中,59%为⼥性,41%为男性
这个数据集⾮常适合做多⻆度多⼈脸检测,关键点定位和头部姿态估计

8.300W数据集

地址300W数据集

包含300张室内图像和300张室外图像,标注了68个关键点

数据集内部的表情、光照条件、姿态、遮挡、脸部⼤⼩变化⾮常⼤,是通过Google搜索party和conference等较难场景搜集⽽来。

9.MTFL数据集

地址MTFL数据集

包含12 995张⼈脸图像、5个关键点标注,另外也提供了性别、是否微笑、是否佩戴眼镜及头部姿态的信息。

MAFL(Multi-Attribute Facial Landmark)数据集则包含20 000张⼈脸图像,5个关键点标注与40个⾯部属性。其被包含在Celeba数据集中。

两数据集都使⽤TCDCN⽅法将原来的标注拓展到了68个关键点的标注

10.WFLW数据集

地址WFLW数据集

包含10 000张⼈脸图像,其中7500张⽤于训练,2500张⽤于测试,共98个关键点。除了关键点之外,还有遮挡、姿态、妆容、光照、模糊和表情等信息的标注

四.⼈脸识别图像数据集

1.FERET数据集
地址FERET数据集

包含14 051张多姿态、不同光照的灰度⼈脸图像,每幅图中均只有⼀个⼈脸

2.Yale⼈脸数据库&Yale B⼈脸数据库
地址Yale⼈脸数据库&Yale B⼈脸数据库

是早期的灰度数据集,包含15位志愿者的165张图像,图像中包含光照、表情和姿态的变化

Yale B⼈脸数据库升级版的Yale,包含10个⼈的5760张多姿态、多光照的图像。具体包括9个姿态、64种光照变化,在实验室严格控制的条件下进⾏。

3.LFW数据集

地址LFW数据集

包含5749个⼈的13 233张全世界知名⼈⼠的图像,其中的1680⼈有2张或2张以上⼈脸图像。

研究⾮限制环境下的⼈脸识别问题
在⾃然环境下拍摄,包含不同背景、朝向、⾯部表情。每张图像都被归⼀化到250×250⼤⼩

4.CALFW数据集

地址CALFW数据集

是LFW数据集的拓展,包含3000对具有较⼤年龄跨度的⼈脸图像

⽤于评估⼈脸识别算法在跨年龄识别中的性能

5.CAS-PEAL⼈脸数据库

地址CAS-PEAL⼈脸数据库

提供⼀个⼤规模的中国⼈脸数据集⽤于训练和评估对应东⽅⼈的算法,由1040个⼈(595个男性和445个⼥性)的99 594张图像组成

在特定环境下具有不同的姿势、表情、照明条件、表情及是否佩戴眼镜等信息。对每个被拍摄的⼈,通过9 个相机来同时捕获不同姿态的图像,平均每⼀个⼈采集了约900张图像

6.CMU PIE数据集
地址CMU PIE数据集

包含68位志愿者的41 368张图像,每个⼈有13种姿态条件、43种光照条件和4种表情。

7.Multi-PIE数据集

地址Multi-PIE数据集

包含337个⼈、在15个⻆度、19个照明条件和不同的表情下的记录,最终超过750 000张图像。由于图像质量较⾼,原始的图像⼤⼩超过了300GB,⽤户需要购买使⽤

8.Pubfig数据集

地址Pubfig数据集

是哥伦⽐亚⼤学的公众⼈物脸部数据集,包含200个⼈的58 797张⼈脸图像,总共标注了73个⼈脸属性

具有很好的姿态、光照、表情和场景多样性,可⽤于⾮限制场景下的⼈脸识别

9.MSRA-CFW数据集

地址MSRA-CFW数据集

包含1583个⼈的202 792张图像,采⽤了⾃动标注的⽅法

10.CASIA-WebFace数据集

地址CASIA-WebFace数据集

是中国科学院⾃动化研究所李⼦⻘实验室开放的国内⾮常有名的数据集,包含10 575个⼈的494 414张图像

11.FaceScrub数据集

地址FaceScrub数据集

总共包含530个⼈的106 863张图像。其中,男性、⼥性各占265⼈,分别包括55 306和51 557张图像,每个⼈⼤概200张图像

12.UMDFaces数据集

地址UMDFaces数据集

这个数据集有静态图和视频两部分,其中静态图包含8277个⼈的367 888张⼈脸图像,视频包含22 075个视频中的3107个⼈的3 735 476张图像。同时标注了21个关键点、性别信息及人的3个姿态

13.MegaFace数据集

地址MegaFace数据集

包含100万张图像,共690 000个⼈

14.MS-Celeb-1M数据集

地址MS-Celeb-1M数据集

包含 [公式] 张图像,测试集包括1000个名⼈,这1000个名⼈从100万个明星中随机挑选,每个名⼈⼤概有20张图

获取是从100万个名⼈中,根据受欢迎程度,选择10万个,然后利⽤搜索引擎,给10万个⼈每⼈搜⼤概100张图像,共得到10万×100=1000万张图像。

15.VGG Face数据集

地址VGG Face数据集

发布于2015年,包括2622个对象且每个对象拥有约1000张静态图像。

VGG Face2数据集发布于2017年,包含9131个⼈的331万张图像,平均每⼀个⼈有362.6张图像;约有59.7%的男性;还包括⼈脸框、5个关键点,以及估计的年龄和姿态

16.IJB-A数据集

地址IJB-A数据集

包含来⾃500个对象的5396张静态图像和20 412帧的视频数据。2017年迭代到IARPA Janus B,2018年迭代到IARPA Janus C

被拍摄者来⾃世界不同国家、地区和种族,具有⼴泛的地域性,在完全⽆约束环境下采集

17.IMDB-Face数据集

地址IMDB-Face数据集

发布于2018年,这是⼀个经过⼈⼯清理标签的⼲净⼈脸识别数据集,包含590 000个⼈的170万张图像

18.RFW数据集

地址RFW数据集

发布于2019年,这是⼀个研究⼈脸识别算法中种族偏移问题的数据集,总共包含4类⼈种,即Caucasian、Indian、Asian和African。
其中,Caucasian包含2959个⼈的10 196张⼈脸图像;Indian包含2984个⼈的10 308张⼈脸图像; Asian包含2492个⼈的9688张⼈脸图像;African包含2995个⼈的10 415张⼈脸图像

五.⼈脸识别视频数据集

1.YouTube Faces DB数据集

地址YouTube Faces DB数据集

可⽤来做⼈脸验证。包含1595个⼈的3425段视频,最短的为48帧,最⻓的为6070帧

2.PaSC数据集

地址PaSC数据集

发布于2014年,是⼀个图像和视频⼈脸数据集,包含9376张静态图及293个⼈的2802个视频

3.iQIYI-VID数据集

地址.iQIYI-VID数据集

发布于2018年,是当前全球最⼤的明星视频数据集,包含5000位明星艺⼈,⻓达1000h共50万条视频⽚段,每条视频的⻓度是1~30s

进⾏多模态(⼈脸、声⾳、动作及服装等特征)⼈物识别的挑战研究

六.三维⼈脸识别数据集

1.ND-2006数据集

地址ND-2006数据集

发布于2006年,包含888个⼈,每⼀个⼈约60张图像,共13 450张图像,包含6种不同的表情

2.bosphorus数据集

地址bosphorus数据集

发布于2008年,是⼀个使⽤结构光设备采集的3D⼈脸数据集,它包含105个⼈的4666张三维⼈脸图像,被采集者距离设备1.5m,采集的姿态为正脸

七.⼈脸识别其他数据集

1.MeGlass数据集

地址MeGlass数据集

发布于2019年,是⼀个戴眼镜的⼈脸识别数据集,包括1710个⼈的14 832张有眼镜图像和33 087张⽆眼镜图像

2.LAG Dataset数据集

地址LAG Dataset数据集

发布于2018年,是⼀个跨年龄的⼈脸识别数据集,它包括1010个⼈的3828张图像,每⼀个⼈都⾄少包括⼀组⼩孩/年轻⼈,或者成⼈/⽼⼈的照⽚

3.iCartoonFace数据集

地址iCartoonFace数据集

发布于2019年,是⼀个卡通⼈脸识别数据集,包括2639个⼈物形象,共68 312张图像,来⾃于爱奇艺中的卡通视频和搜索引擎中的图像

八. 通⽤⼈脸属性分析数据集

1.FaceTracer数据集

地址FaceTracer数据集

发布于2008年,该数据集包括15 000张⼈脸,共10组属性,包括性别、种族、年龄、头发颜⾊、是否佩戴眼镜、是否有胡须、是否微笑、是否模糊、光照条件及室内还是室外环境,这是⽐较早期的⼈脸属性数据集

2.Pubfig数据集

前面已有介绍

3. LFWA数据集&CelebA数据集

地址LFWA数据集&CelebA数据集

LFWA数据集的图像全部来⾃于LFW⼈脸识别数据集

CelebA数据集则包含10 177个名⼈的202 599张⼈脸图像,它们标注的⼈脸属性有40种,包括是否戴眼镜、是否微笑等

4.Fairface数据集

地址Fairface数据集

发布于2019年,共包括108 501张图像

该数据集共包括White、Black、Indian、East Asian、Southeast Asian、Middle East及Latino 7类⼈种,图像来源于YFCC-100M Flickr数据集,标注属性包括⼈种(Race)、性别(Gender)、年龄组(Age Group)

九.⼈脸表情数据集

1.JAFFE数据集

地址JAFFE数据集

⼀共有213张图像,10个⼈每⼈做出7种表情,这7种表情分别是难过(sad)、⾼兴
(happy)、⽣⽓(angry)、厌恶(disgust)、惊讶(surprise)、害怕(fear)、中⽴
(neutral),每组⼤概20张样图

2.KDEF(Karolinska Directed Emotional Faces)数据集
地址KDEF(Karolinska Directed Emotional Faces)数据集

这个数据集包含70个⼈,共35个男性和35个⼥性,年龄在20~30岁;没有胡须、⽿环或眼镜, 并且没有明显的化妆;7种不同的表情,每个表情有5个⻆度。该数据集总共有4900张彩⾊图,尺⼨ 为562×762像素

3.GENKI数据集

地址GENKI数据集

包含GENKI-R2009a、GENKI-4K、GENKI-SZSL⼏个部分

GENKI-R2009a包含11 159张图像,GENKI-4K包含4000张图像,分为“笑”和“不笑”两种,每张图像拥有不同的尺度⼤⼩、姿势、 光照变化、头部姿态,可专⻔⽤于做笑脸识别。这些图像包括⼴泛的背景、光照条件、地理位置、 个⼈身份和种族等信息

4.RaFD数据集

地址RaFD数据集

是⼀个⾼质量的脸部数据库,总共包含67个模特,其中有20个⽩⼈男性成年⼈、19个⽩⼈⼥性成年⼈、4个⽩⼈男孩、6个⽩⼈⼥孩和18个摩洛哥男性成年⼈。该数据集总共8040张图,包含8种 表情,即愤怒、厌恶、恐惧、快乐、悲伤、惊奇、蔑视和中⽴。每个表情包含3个不同的注视⽅ 向,并且使⽤5个相机从不同的⻆度同时拍摄。

5.Cohn-Kanade AU-Coded Expression Database数据集

地址Cohn-Kanade AU-Coded Expression Database数据集

包含137个⼈的不同⼈脸表情视频帧

可以免费获取,包含表情的标注和基本Action Units的标注

6.Fer2013数据集

地址Fer2013数据集

包含共26 190张48×48灰度图,图像的分辨率⽐较低,共7种表情,分别为⽣⽓(anger)、厌恶(disgust)、恐惧(fear)、开⼼(happy)、伤⼼(sad)、惊讶(surprised)、中⽴(normal)

7.RAF(Real-world Affective Faces)数据集

地址RAF(Real-world Affective Faces)数据集

发布于2017年,总共包含29 672张图像,其中,7个基本表情和12个复合表情,⽽且每张图还提供了5个精确的⼈脸关键点,包含年龄范围和性别标注 等

8.EmotioNet数据集

地址EmotioNet数据集

发布于2017年,共950 000张图,其中包含基本表情、复合表情,以及表情单元的标注

9.AffectNet数据集

地址AffectNet数据集

超过42万张图
AffectNet数据集的标注类型包括表情类型和幅度,其中表情类型包括中⽴、⾼兴、悲伤、惊讶、害怕、厌恶、愤怒和轻蔑8种基本表情,以及⽆表情、不确定和⽆⼈脸。

十.⼈脸年龄与性别数据集

1.FGNet数据集

地址FGNet数据集

包含82个⼈的1002张图像,年龄范围是0~69岁

2.CACD2000数据集

地址CACD2000数据集

发布于2013年,这是⼀个名⼈数据集,包含2000个⼈的163 446张名⼈图像,年龄范围16~62岁

3.Adience数据集

地址Adience数据集

共2284个⼈26 580张图像。它的标注采⽤的是年龄段的形式⽽不是具体的年龄,其中,年龄段分为0~2、4~6、8~13、15~20、25~32、38~43、48~53、60+

4.IMDB⼈脸数据库

地址IMDB⼈脸数据库

包含460 723张⼈脸图像,⽽Wikipedia⼈脸数据库包含62 328张⼈脸数据库, 总共523 051张⼈脸数据

对年龄识别和性别识别的研究有着重要的意义,这是⽬前年龄和性别识别最⼤的数据集

5.MORPH数据集

地址MORPH数据集

发布于2017年,包括13 000多个⼈的55 000张图像,年龄范围是16~77岁

十一.⼈脸分割数据集

1.Helen Parsing Dataset数据集

地址Helen Parsing Dataset数据集

包含2000张训练图像和330张测试图像

共包含10类⾯部区域的标注,分别是Face skin、Left eye、Right eye、Left brow、Right brow、Nose、Inner mouth、Upper lip、Lower lip和Background,标注的⽅法是每⼀个类别都单独存储为⼀张图像。

2.CelebAMask-HQ数据集

地址CelebAMask-HQ数据集

图像⼤⼩均为512×512,包括skin、nose、eyes、eyebrows、ears、mouth、lip、hair、hat、eyeglass、earring、necklace、neck及cloth区域

3.LIP数据集

地址LIP数据集

共包含50 462张图像,19个语义标注,分别是hat、hair、sunglasses、upper-clothes、dress、coat、socks、pants、gloves、scarf、skirt、jumpsuits、face、right arm、left arm、right leg、left leg、right shoe、left shoe,其中,训练数据集有30 462张图像,测试集和验证集各有10 000张图像

4.MHP数据集

地址MHP数据集

MHP v1.0包含4980张图像,每⼀张⾄少2个⼈,其中,训练集3000张,验证集1000张,测试集980张。其除了背景外,包含18个语义类,分别是hat、hair、sunglasses、upper clothes、skirt、pants、dress、belt、left shoe、right shoe、face、left leg、right leg、left arm、right arm、 bag、scarf、torso skin

MHP v2.0数据集包含25 403张图,训练集包含15 403张图,验证集和测试集都是5000张图。MHP v2.0包含58个语义级别的标签,分别是cap/hat、helmet、face、hair、left-arm、right-arm、left-hand、right-hand、protector、bikini/bra、jacket/windbreaker/hoodie、t-shirt、polo-shirt、sweater、sin- glet、torso-skin、pants、shorts/swim-shorts、skirt、stock-ings、socks、left- boot、right-boot、left-shoe、right-shoe、left-highheel、right-highheel、left-sandal、right- sandal、left-leg、right-leg、left-foot、right-foot、coat、dress、robe、jumpsuits、other-full- body-clothes 、 headwear 、 backpack 、 ball 、 bats 、 belt 、 bottle 、 carrybag 、 cases 、 sunglasses、eyewear、gloves、scarf、umbrella、wallet/purse、watch、wristband、tie、other- accessaries、other-upper-body-clothes和other-lower-body-clothes

十二.⼈脸颜值数据集

1.SCUT-FBP5500数据集

地址SCUT-FBP5500数据集

发布于2017年,数据集共5500个正⾯⼈脸图像,年龄分布为15~60,全部都是⾃然表情。包含不同的性别分布和种族分布(2000个亚洲⼥性、2000个亚洲男性、750个⾼加索男性、750个⾼加索⼥性)

每⼀张图由60个⼈进⾏评分,共评为5个等级,这60个⼈的年龄分布为18~27岁,均为年轻⼈,适⽤于基于表观和形状等的模型研究。同时,每⼀张图像中都提供了86个关键点的标注

2.Selfier数据集

地址Selfier数据集

包含46 836张⾃拍图,每⼀张图像都标注了受欢迎的分数。然后标注了36种属性,分为以下组别,前⾯是属性,后⾯是具体的分类

性别:is female
年龄:baby、child、teenager、youth、middle age、senior
种族:white、black、asian
脸型:oval、round、heart
脸部表情:smiling、frowning、mouth open、tongue out、duck face
头发颜⾊:black、blond、brown、red
发型:curly、straight、braid
装饰:glasses、sunglasses、lip-stick、hat、earphone
其他:showing cellphone、using mir-ror、having braces、partial face
光照条件:harsh、dim

十三.⼈脸妆造数据集

1.妆造数据集

地址妆造数据集

包含四个子集:

1.YMU(YouTube化妆)是从YouTube(YouTube⽹址为http:// www.antitza.com/URLs_YMU.txt)视频化妆教程中获取的⾯部图像。
2.VMU(虚拟化妆):从FRGC数据库中采集的⾼加索⼥性受试者的⾯部图像,使⽤公开的软件来合成的虚拟化妆样本,软件来⾃www.taaz.com
3.MIW:从互联⽹获得的有化妆和没有化妆的受试者的前后对⽐⾯部图像
4.MIFS:化妆诱导⾯部欺骗数据集,这是从YouTube化妆视频教程的107个化妆视频中获取的。每⼀组包含3张图像,其中⼀张图像是⽬标⼈物化妆前的主体图像,⼀张是化妆后的图像,最后⼀ 张是其他⼈化同样的妆试图进⾏欺骗的图像

2.妆造迁移数据集

地址妆造迁移数据集

发布于2018年,包括3834张⼥性⼈脸图像,其中有1115张⽆妆造⼈脸图像和2719张有妆造⼈脸图像。妆造类型包括不同程度的烟熏妆(Smoky-eyes makeup style)、华丽妆
(Flashy makeup style)、复古妆(Retro makeup style)、韩式妆(Korean makeup style)及⽇式妆(Japanese makeup style)

十四.⼈脸姿态数据集

1.Bosphorous Database数据集

地址Bosphorous Database数据集

包含105个⼈的4666张⼈脸图像,每⼀张⼈脸图像有35种表情及不同的仿真姿态

研究三维⼈脸表情的数据集

2.BIWI数据集

地址BIWI数据集

发布于2010年,包含1000个⾼质量的3D扫描仪和专业⻨克⻛采集的3D数据

3.Head Pose Image数据集

地址Head Pose Image数据集

包括5580张图像,其中有372个⼈,每个⼈有15张图像

标注包括垂直⻆度和⽔平⻆度。

4.BIWI Kinect_headpose数据集

地址BIWI Kinect_headpose数据集

包含20个⼈的15 000张图像,有3D的标注,图像⼤⼩为640×480

5.TMU数据集

地址TMU数据集

发布于2015年,是⼀个⾯部视频数据库,包含31 500个100名志愿者的视频

每个志愿者在7个照明条件下由9组同步⽹络摄像头拍摄,并被要求完成⼀系列指定的动作,有不同的遮挡、照明、姿势和表情的⾯部变化。
提供了具有严格时间同步的多视图视频序列

6.UPNA Head Pose Database数据集

地址UPNA Head Pose Database数据集

发布于2016年,包括10个⼈的⼈脸视频,其中有6个男性和4 个⼥性,每个⼈12个视频(6个规定的动作和6个⾃由的动作)。分辨率为1280×720,每秒30帧, 每⼀个视频10s,有3D标注信息

十五.⼈脸三维重建数据集

1.BFM数据集

地址BFM数据集

包含100个男性和100个⼥性的3D扫描数据,是⼈脸三维重建领域影响最⼤的数据集,堪称3D⼈脸领域的hello world

使⽤3DMM(3D Morphable Model,3D形变模型)的数据集,在该数据集中还标注了表情系数、纹理系数,有68个关键点的坐标及相机的7个坐标

2.FaceWarehouse数据集

地址FaceWarehouse数据集

数据集⾥都是中国⼈。它共包含150个⼈,年龄为7~80岁。相⽐于3DMM数据集,它增加了表情,每个⼈包含20种不同的表情(1个中性表情和19个张嘴、微笑等表情)

3.300W-LP数据集

地址300W-LP数据集

是基于300W数据集和3DMM仿真得到的3D数据集,是3D领域⾥使⽤最多、使⽤最⼴泛的仿真数据集,包含68个关键点、相机参数及3DMM的系数的标注

十六.⼈脸活体数据集

1. NUAA数据集

地址NUAA数据集

包含采集的15个⼈脸图像。以每秒20帧,对每⼀个正⾯⼈脸姿态和中性表情进⾏采集,每⼀个⼈采集500张图,分辨率⼤⼩为640×480

2.Replay-Attack Database数据集

地址Replay-Attack Database数据集

是⼀个重放攻击⼈脸数据集,包含50个⼈的1300个视频

3.3DMask Attack数据集

地址3DMask Attack数据集

发布于2013年,包含17个⼈的76 500张图像,使⽤Kinect进⾏采集

每⼀组视频包含5个视频,每⼀个视频300帧,每个帧包括⼀张深度图像、相应的RGB图像和⼿动标注的眼睛位置。其中,每帧分辨率是640×480,包含8位RGB图像和11位深度图像,采集者的 姿态是正⾯和中立表情

4.MSU USSA数据集

地址MSU USSA数据集

是⼀个活体检测数据集 ,包含9000张图像,其中1000张为真实图,8000张为伪造图,即⾮活体图

5.SiW数据集

地址SiW数据集

发布于2016年,是⼀个活体检测数据集,包含165个⼈,每个⼈包含8段真实的视频,多达20段伪造的视频,总共4478个视频。视频的分辨率为1080p,帧率是每秒30帧

6.WFFD数据集

地址WFFD数据集

发布于2019年,是⼀个3D⼈脸蜡像数据集,总共包含2200对真实⼈脸和蜡像⼈脸图

7.CASIA-SURF数据集

地址CASIA-SURF数据集

包括1000个⼈的21 000个视频

同时采集RGB、Depth和InfraRed(IR)视频。其中,RGB图像分辨率为1280×720,Depth和IR 的分辨率为640×480。每⼀个样本会录制⼀个真实视频及6个攻击视频,攻击类型包括遮挡住眼睛、⿐⼦、嘴等区域

十七.⼈脸伪造数据集

1.FaceForensics++数据集

地址FaceForensics++数据集

发布于2019年,使⽤Face2Face、FaceSwap、DeepFakes及NeuralTextures共4种换脸算法对1000个真实视频进⾏处理,各⾃得到了510 207张真假脸对应的图像

2.DFW数据集

地址DFW数据集

发布于2018年,包括1000个⼈的11 157张图像,它是IBM发布的⼀个妆造⼈脸数据集,主要包括遮挡和伪造⼈脸。总共有1000张正脸图、903张验证图、4814张妆造图、4440张伪造(另⼀个⼈)图

十八.⼈脸⻛格化数据集

1.CUFSF数据集

地址CUFSF数据集

有1195张成对的灰⾊正⾯肖像图和对应的素描图

2.IIIT-CFW1.0数据集

地址IIIT-CFW1.0数据集

发布于2016年,包含100个名⼈的8928张卡通图像,同时也附带了1000张真实图

3.CartoonSet10/100k数据集

地址CartoonSet10/100k数据集

发布于2017年,有两个⼦集,即CartoonSet10k和CartoonSet-100k,分别包含10 000和100 000张卡通⼈脸图像。每⼀张卡通⼈脸图像都有16个组件,其中有12个⾯部属性和4个颜⾊属性

艺术⻛格总共包括3种下巴⻓度(chin_length)、3种眼睛⻆度(eye_angle)、2种睫⽑可⻅与否属性(eye_lashes)、2种眼睑样式(eye_lid)、14种眉⽑形状(eyebrow_shape)、2种眉⽑宽 度(eyebrow_weight)、7种脸型(face_shape)、15种⾯部发型(facial_hair,包括光头)、12 种眼镜(glasses,包括⽆眼镜)、111种头部发型(head hair)。

颜⾊⻛格包括5种眼虹膜颜⾊(eye_color)、11种⾯部⽪肤颜⾊(face_color)、7种眼镜颜⾊(glasses_color)、10种头发颜⾊(hair_color)。

⽐例⻛格包括3种眼睛眉⽑距离(eye_eyebrow_distance)、3种眼缝⼤⼩(eye_slant)、4种眉⽑ 厚度(eyebrow_thickness)、3种眉⽑宽度(eyebrow_width)

约250个卡通艺术元素,可以组合成约108种样式

4.self2anime数据集

地址self2anime数据集

发布于2019年,这是⼀个漫画⼈脸数据集,共3500张⼥性的⼈脸图,其中3400张⽤于训练,100张⽤于测试

  • 11
    点赞
  • 113
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
OpenCV是一种广泛应用于计算机视觉领域的开源计算机视觉库。在人脸识别任务中,我们需要训练一个可以识别人脸的模型。为了训练这个模型,我们需要准备一个样本数据集,该数据集包含正样本和负样本。 正样本指的是我们希望模型成功识别出来的人脸图像。这些正样本应该是尽可能多种多样的人脸,包括不同年龄、种族、性别、表情等。我们可以从各种渠道获取这些正样本,如网络上的公开数据集、社交媒体等。为了获得更好的效果,我们还可以通过手动标注人脸位置和关键点来提供更准确的数据。 负样本指的是非人脸的图像。这些负样本可以是各种各样的图片,包括风景、动物、物体等。目的是让模型能够区分人脸和非人脸。负样本的数量应与正样本数量相当,以保持数据平衡,并帮助模型更好地学习区分特征。 在构建样本数据集时,我们应该尽可能地获取更多的样本,以提高模型的鲁棒性和准确性。此外,还应该注意数据的质量和多样性。优质的样本数据集对于训练出高质量的人脸识别模型至关重要。 总之,构建一个包含正样本和负样本的人脸识别样本数据集是进行人脸识别模型训练的关键步骤。该数据集应该包含多样性的人脸正样本和与之相等数量的负样本,以在训练过程中有效区分人脸和非人脸。同时,我们应该重视数据的质量和多样性,以提高模型的准确性和鲁棒性。
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值