©PaperWeekly 原创 · 作者|燕皖
单位|渊亭科技
研究方向|计算机视觉、CNN
活体检测在人脸识别中的重要环节。以前的大多数方法都将面部防欺骗人脸活体检测作为监督学习问题来检测各种预定义的演示攻击,这种方法需要大规模的训练数据才能涵盖尽可能多的攻击。
但是,训练好的模型很容易过度拟合几种常见的攻击,仍然容易受到看不见的攻击。为了克服这些问题,活体检测算法应该:1)学习 discriminative features,可以从预定义的攻击样本中泛化出没有见到的攻击样本;2)快速适应新的攻击类型。
本文总结了在静默活体检测领域中提出的最新方法,并将它们分为六大类。如下,并对每一类中经典的算法进行了介绍。当然,除了静默活体检测,还有炫光、动作等,其他方法不再本文的讨论范围。
Auxiliary supervision
-
rPPG
Depth
Temporal
fft
De-spoofing
Domain Generalization
Meta learning
NAS
Auxiliary supervision
仅仅使用 binary classification 监督不够合理,因为也不能说明模型是否学习到真正的活体与攻击之间差异。因此,出现了 rPPG、Depth、Temporal、fft 等等监督。
论文标题:Learning Deep Models for Face Anti-Spoofing Binary or Auxiliary Supervision
论文来源:CVPR 2018
论文链接:https://arxiv.org/abs/1803.11097
本文探讨了辅助监督(auxiliary supervision)的重要性。这些辅助信息是基于我们关于真实人脸和欺诈面部之间关键差异的知识获得的,其中包括两个视角:空间和时间。其中空间就是图像的深度(face-depth),而时间就是使用时序 rPPG 信号作为辅助监督。
本文的三个主要贡献:
建议利用新颖的辅助信息(即深度图和 rPPG)来监督 CNN 学习以改进泛化。
提出了一种新颖的 CNN-RNN 架构,用于端到端学习深度图和 rPPG 信号。
发布了一个新的数据库:Spoof in the Wild Database(SiW)。
What is rPPG?
简单说就是发射光强度不一样。当一定波长的光束照射到指端皮肤表面时,光束将通过透射或反射方式传送到光电接收器,在此过程中由于受到指端皮肤肌肉和血液的吸收衰减作用,检测器检测到的光强度将减弱。
如下图所示,如果是 live face,会有部分周围光穿过皮层到达血管,然后反射出来,故相机是能从人体皮肤检测到心跳;而对于 spoof face,由于材料不同,吸收及反射到相机的信息就很不同。
论文标题:Exploiting temporal and depth information for multi-frame face anti-spoofing
论文来源:CVPR 2018
论文链接:https://arxiv.org/abs/1811.05118
以往关于活体的深度学习研究都提取了单帧的深度信息作为辅助监督。不同于这些方法,这篇文章提出了一种通过结合时序运动和单帧面部深度的时序深度度信息。具体的,光流引导特征模块(OFFB)和时序卷积单元(ConvGRU)分别用于提取短时和长时运动信息。
如图所示,输入是固定间隔内的连续帧。单帧框架部是为了提取不同层次的特征,输出单帧估计的面部深度。OFFB 使用连续两帧作为输入,计算