DeepFace: Closing the Gap to Human-Level Performance in Face Verification
这篇文章是Facebook公司发表于CVPR2014的Oral文章, 这段时间非常火,一众科技媒体都在热炒“计算机的人脸识别能力正在赶超人类或者已经赶超了人类”,甚至微博上有人断言,CV研究的最高境界就是“用最牛的机器,实现最深度的算法”。铺垫到此为止,我们进入正题,由我的视角带领大家读一读这篇火的一谈糊涂的文章。
0. 本文的贡献
DeepFace一文依旧是沿着“检测-对齐-人脸表示-分类”这一人脸识别技术路线来的,其贡献在于对人脸对齐和人脸表示环节的改进。1)在人脸对齐环节,引入了3D人脸模型对有姿态的人脸就行分片的仿射对齐。2)在人脸表示环节,利用一个9层的深度卷积在包含4000人、400万张人脸的数据集上学习人脸表示,这个9层的DCNN网络有超过1.2亿个参数。本文的模型在LFW数据集上取得了97.25%的平均精度(逼近了人类97.5%的极限),同时在Youtube数据集上取得了当前最好的结果,比之前的NO.1整整高出了12.7%。
1. 人脸对齐
人脸对齐是人脸特征抽取前的预处理步骤,在real-world条件下,受姿态和表情影响,人脸对齐是一个困难的任务。本文提出了一种借助3D模型的人脸稠密对齐方法,见下图:
其基本步骤是:1. 检测六个面部关键点 2. 基于六个关键点进行人脸全局仿射变换。3. 检测67个面部关键点,并对人脸进行三角剖分。4. 将3D人脸转到当前对齐人脸同一视角并获得三角块的可见性。5. 利用3D模型产生新的67个关键点位置及其三角剖分 6. 分片仿射变换得到的正面人脸。