Widerface数据集是一个人脸检测的主流数据集。
里面有32203张人脸图像,393703个标注人脸,且各类场景十分复杂。为了深入分析各类误检,作者还对每个人脸bbox还标注了多属性:遮挡、姿态、事件等,可以全方位多角度的评估算法的性能。
wider face可以划分为60类事件,每类事件中的图像按照:训练 / 验证 / 测试:40% / 10% / 50%的比例划分,共包含两种训练 / 测试方案:
1 Scenario-Ext:使用外部数据训练,不使用wider face训练集,仅在wider face测试集上评估性能;
2 Scenario-Int:使用wider face训练 / 验证集做训练,在wider face测试集上评估性能;
同时基于EdgeBox的检出率,将wider face设定为Easy、Medium、Hard三个级别,难度逐级递增,且数据逐级包含。
下面是Wider face数据集标签的格式:
< image name i >
< number of faces in this image = im >
< face i1 >
x1, y1, w, h, blur, expression, illumination, invalid, occlusion, pose
< face i2 >
x1, y1, w, h, blur, expression, illumination, invalid, occlusion, pose
...
< face im >
x1, y1, w, h, blur, expression, illumination, invalid, occlusion, pose