MaskedFace-Net | 新冠疫情中的口罩检测(附论文及源代码)

MaskedFace-Net | 新冠疫情中的口罩检测(附论文及源代码)

原创 Edison_G 计算机视觉研究院 5月9日

收录于话题

#深度学习框架50

#算法56

#深度学习96

#人脸检测识别28

 

作者:Edison_G

戴口罩似乎是限制covid-19传播的一种解决方案。在这种情况下,有效的识别系统被期望用于检查人在被管制的区域是否戴口罩。因此,对于训练深度学习模型来检测戴口罩的人和不戴口罩的人,一个大量的戴口罩的人脸数据集是必要的。

一、简要

目前,没有可用的大型戴口罩人脸图像数据集允许检查面部是否正确遮挡。事实上,由于不良行为或个人(如儿童、老年人)的原因,许多人没有正确地戴上口罩。由于这些原因,一些戴着口罩的活动打算让人们了解这个问题和良好的做法。

图片

从这个意义上说,有研究者就提出了一种图像编辑方法和三种遮挡人脸检测数据集;即正确遮挡人脸数据集(CMFD)、错误遮挡人脸数据集(IMFD)及其全局遮挡人脸检测(MaskedFace-Net)的组合。现实的遮挡人脸数据集有两个目标:

i)检测他们是否有戴口罩;

ii)检测是否正确戴口罩(例如在机场入口或人群中)。

据我们所知,没有一个大的遮挡人脸数据集为检测是否戴口罩提供如此细粒度的分类。此外,这项工作在全球提出了应用的遮挡人脸对人脸形变模型,允许生成其他遮挡人脸图像。新提出的遮挡人脸数据集可以在https://github.com/cabani/MaskedFace-Net上找到。由NVIDIA公司在线公开提供的Flickr-Faces-HQ3 (FFHQ)数据集,已被用于生成MaskedFace-Net。

二、背景与动机

戴口罩似乎是限制covid-19传播的一种解决方案。在这种情况下,有效的识别系统被期望用于检查人在被管制的区域是否戴口罩。为了完成这项任务,训练深度学习模型需要大量的遮挡人脸数据集来检测。从这个意义上说,在文献中可以找到一些具有病毒相关遮挡的大型人脸图像数据集;

例如:MAsked FAces dataset (MAFA)【Detecting masked faces in the wild with lle-cnns. In 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR)】,
the Real-World Masked Face Dataset (RMFD)【https://github:com/X-zhangyang/Real-World-Masked-Face-Dataset


一个遮挡人脸识别数据集【Masked face recognition dataset and application. ArXiv:2003.09093】,其由Masked Face Detection Dataset (MFDD), Real-world Masked Face Recognition Dataset (RMFRD) and Simulated Masked Face Recognition Dataset (SMFRD) 组成。

图片

三、应用及数据输出

人脸图像数据集(Flickr-Faces-HQ3 (FFHQ))被选为创建一个增强的遮挡人脸图像。实际上,FFHQ包含70000张高质量的人脸图像,PNG文件格式为1024×1024分辨率,并公开提供。FFHQ数据集在年龄、种族、视点、灯光和图像背景方面提供了许多多样性。它最初是作为生成式对抗性网络(GAN)的基准而创建的。

全局数据流程图如下图所示。

图片

上图显示了用于生成“correctly/incorrectly masked face images MaskedFace-Net”数据集的图像编辑方法的主要阶段。特别是,MaskedFace-Net数据集是通过定义一个mask-toface deformable model创建的。

图片

(a):depicts the structure of the generated MaskedFace-Net dataset.

(b):shows a pseudo-code of the mask-to-face deformable model applied for generating outputs (a) of the MaskedFace-Net dataset

图片

对于FFHQ【3】的每一个人脸图像(例如上图a所示),基于Haar特征的级联分类器被用于检测一个感兴趣的区域(检测人脸矩形)。然后,一个特定的关键点检测器“预测68个关键点【4】【5】”应用于感兴趣的检测区域,并允许自动检测68个面部结构的坐标(见图b所示的样本)。

【3】:“dataset of face images Flickr-Faces-HQ (FFHQ)” https://github:com/NVlabs/ffhq-dataset.

【4】:“Facial point annotations” https://ibug:doc:ic:ac:uk/resources/facial-point-annotations/.

【5】:“shape predictor 68 face landmarks.dat.bz2” https://github:com/davisking/dlib-models#shape_predictor_68_face_landmarksdatbz2.

此外,还选择了广泛的face protection mask (single-use blue face protection mask)作为映射的参考图像(见下图中的示例)。对于后者,已经手动注释了12个关键点,用于描绘遮挡区域(多边形区域)。

图片

在此阶段,针对目标情况定义了四种mask-to-face映射(见下图)即覆盖鼻子、嘴和下巴,口罩只覆盖鼻子和嘴,口罩只覆盖嘴和下巴,口罩只覆盖嘴以下。

图片

对于每种类型的mask-to-face映射(CMFD、IMFD1、IMFD2或IMFD3),从自动检测到的68个位置中保留12个面部关键点的子集;然后与12个遮挡关键点匹配。通过这种方式,遮挡可以适合每个目标病例的面部的特定区域。因此,创建了一个mask-to-face deformable model来生成MaskedFace-Net。此外,每个目标情况最多可以有2个关键点(在12个关键点中),它们的位置在有限的周长内随机移位。因此,MaskedFace-Net也包含了各种各样的遮挡定位。

图片

最后,应用了基于遮挡图像和人脸图像之间位置所定义的点对点对应关系变换来映射目标人脸区域上的口罩像素。图中显示每种类型的人脸位置实例和对应的口罩映射。

图片

原文地址:https://mp.weixin.qq.com/s/AEIW4R3bfIM1mBs19xaj8w

 

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
YOLOv5是一种目标检测算法,最近它被应用于口罩识别任务。下面是关于YOLOv5口罩识别的总结分析: 1. 算法原理 YOLOv5算法基于深度学习技术,采用了一种基于anchor boxes的目标检测方法。它将输入的图像分成多个网格,每个网格负责检测图像的一个目标。然后,算法使用卷积神经网络从每个网格提取特征,并预测每个网格是否存在口罩以及口罩的位置和大小。这个过程使用的是多层卷积神经网络结构,可以学习到更复杂的特征,从而提高检测的准确率和效率。 2. 数据集 为了训练和测试口罩检测算法,需要使用大量的图像数据。目前有一些公开数据集,例如MMASS、MaskedFace-Net和MAFA等。这些数据集包含了不同种类的图像,可以用于训练和测试口罩检测算法。此外,也可以通过在真实场景采集图像数据来扩充数据集,以提高算法的适用性。 3. 性能评估 为了评估算法的性能,需要使用一些指标。目前常用的指标包括精确率、召回率、F1分数和平均精度均值(mAP)等。这些指标可以帮助我们了解算法在不同情况下的性能,从而进行改进和优化。 4. 应用场景 口罩识别算法可以应用于各种场景,例如公共交通、医院和商场等。在疫情期间,口罩识别技术可以帮助检查人员快速准确地识别出未佩戴口罩的人员,从而保障公共卫生和安全。 总之,YOLOv5是一种高效、准确的口罩识别算法,可以帮助我们应对疫情等重大挑战。在未来,随着技术的不断发展和应用场景的不断扩大,口罩识别技术的应用前景将更加广阔。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值