人脸识别训练集较少_如何训练口罩人脸识别模型?

导读

由于今年新冠肺炎影响,为了减少病毒的传染,在进入各种公共场合、火车站、地铁站、商场等我们都需要佩戴好口罩。为了减少感染的可能性,我们要尽可能的减少摘下口罩的时间。然而,这对我们的人脸识别系统存在一定的挑战,当我们带上口罩的时候会遮挡住人脸大部分的人脸特征,从而会导致我们的人脸识别模型性能急剧下降甚至识别不出来的

如何保证戴口罩也能够识别正确,成为了我们算法研发人员的一个挑战?人脸识别其实已经是一个非常成熟的应用,已经成功在多种场景落地,人脸登录刷脸支付等。而且我们也不缺少没有戴口罩的人脸数据,戴口罩的人脸数据相对来说还是比较少的,由于缺少数据这就导致我们无法训练出一个好的模型。那么我们应该如何来解决这个问题呢

d604abe1712cfe21fd9cfa0add0f9d3e.png

解决方案

目前针对口罩人脸识别,主要有两种解决办法:

  1. 收集大量的口罩人脸数据,利用训练人脸识别的方法来训练一个口罩人脸识别的模型
  2. 采用眼周识别,口罩人脸识别主要是利用眼部以及眉毛特征来识别的。所以,我们可以先训练一个模型用来检测眼周位置,然后再针对眼周的图片,来训练一个基于眼周的识别模型

第一种解决方案,目前缺少口罩人脸数据,如何收集大量的口罩人脸数据是一个问题。解决方案二,可以利用现有公开的人脸数据,关于眼周特征的标记可以采用考虑人脸特征点检测算法定位眼周区域,然后利用收集到的眼周数据,再去训练一个眼周的识别模型

人脸口罩数据

早前,武汉大学发布了一个全球最大的人脸口罩数据集RMFD(Real-World Masked Face Dataset)。目前该数据集,已经公布在了GitHub上,大家可以去下载

git地址:https://github.com/X-zhangyang/Real-World-Masked-Face-Dataset

该数据集主要分为两部分:真实人脸口罩数据模拟口罩人脸数据

  • 真实口罩人脸识别数据集

从网络爬取样本,经过整理、清洗和标注后,含525人的5千张口罩人脸9万正常人脸

下载地址: https://pan.baidu.com/s/1XvGepj84SCA9rlVb9rGhEQ 密码:j3aq

或者 https://drive.google.com/open?id=1UlOk6EtiaXTHylRUx2mySgvJX9ycoeBp

  • 模拟口罩人脸识别数据集

给公开数据集中的人脸戴上口罩,得到1万人、50万张人脸的模拟口罩人脸数据集。基于开源的人脸数据,模拟出来的口罩人脸数据

WebFace模拟口罩人脸数据集

下载地址: https://pan.baidu.com/s/1Qi_8D_kH2QCm761elZs5YA 密码: 77m8

或者 https://drive.google.com/open?id=1q0ibaoFVEmXrjlk3-Oyx2oYR8HpVy6jc

LFW模拟口罩人脸数据集:

下载地址:https://pan.baidu.com/s/1Ge0KcYgu6oVAbLlDHCKwRg 密码: o126

或者 https://drive.google.com/open?id=1soLIUkGruSKMzg5z5_OYYqUVoca4E_lI

87e57f5501b2f39c6fed5f746061bc7e.png

如果你觉得上面的数据还是太少,可以利用开源的人脸数据集,来模拟更多的口罩人脸数据,我这里收集了一些人脸数据,大家有需要的话可以,后台私信回复:"人脸数据",自动获取链接

6230d3f88961f90fba955b1ccf861c82.png

这篇是训练口罩人脸识别模型的第一篇,下篇文章我们将介绍如何通过脚本利用现用的开源人脸数据来合成口罩人脸数据

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值