人脸识别技术大总结1——Face Detection & Alignment

最新推荐文章于 2024-05-09 09:35:35 发布

置顶

超然联盟品牌

最新推荐文章于 2024-05-09 09:35:35 发布

阅读量455

点赞数

分类专栏：人脸识别文章标签：人脸识别人脸识别技术人脸识别

本文链接：https://blog.csdn.net/weixin_44263369/article/details/88896488

版权

本文深入探讨了人脸识别技术的两大关键步骤——人脸检测和特征点定位。作者介绍了MSRA在2014年提出的Joint Cascade Face Detection and Alignment方法，该方法在30ms内同时完成检测和对齐，具有高精度和低内存占用。文章详细讨论了级联检测分类器和级联回归校准，并阐述了如何通过决策树、随机森林等技术优化这一过程。

摘要由CSDN通过智能技术生成

搞了一年人脸识别，寻思着记录点什么，于是想写这么个系列，介绍人脸识别的四大块：Face detection, alignment, verification and identification(recognization)，本别代表从一张图中识别出人脸位置，把人脸上的特征点定位，人脸校验和人脸识别。（后两者的区别在于，人脸校验是要给你两张脸问你是不是同一个人，人脸识别是给你一张脸和一个库问你这张脸是库里的谁。

今天先介绍第一部分和第二部分。主要说三篇顶会文章。

==================================

关键词：人脸检测人脸校准特征点定位决策树随机森林 CART RandForest RandFern Boosting Realboost

==================================

转载注明来自http://www.cnblogs.com/sciencefans/

人脸检测（detection）在opencv中早就有直接能拿来用的haar分类器，基于Viola-Jones算法。但是毕竟是老掉牙的技术，Precision/Recall曲线渣到不行，在实际工程中根本没法给boss看，作为MSRA脑残粉，这里介绍一种MSRA在14年的最新技术：Joint Cascade Face Detection and Alignment（ECCV14)。这篇文章直接在30ms的时间里把detection和alignment都给做了，PR曲线彪到很高，时效性高，内存占用却非常低，在一些库上虐了Face++和Google Picasa，正好契合这篇想讲的东西。可以作为本节的主线。

人脸校准（alignment）是给你一张脸，你给我找出我需要的特征点的位置，比如鼻子左侧，鼻孔下侧，瞳孔位置，上嘴唇下侧等等点的位置。如果觉得还是不明白，看下图：

图中红色框框就是在做detection，白色点点就是在做alignment。

如果知道了点的位置做一下位置驱动的变形，脸就成正的了，如何驱动变形不是本节的重点，在此省略。

首先介绍一下下面正文要写的东西，由于干货非常多所以可能会看着看着就乱了，所以给出框架图：

=================================

废话说了这么多，正文开始~

detection

作者建立了一个叫post classifier的分类器，方法如下：

1.样本准备：首先作者调用opencv的Viola-Jones分类器，将recal阀值设到99%，这样能够尽可能地检测出所有的脸，但是同时也会有非常多的不是脸的东东被检测出来。于是，检测出来的框框们被分成了两类：是脸和不是脸。这些图片被resize到96*96。

2.特征提取：接下来是特征提取，怎么提取呢？作者采用了三种方法：

第一种：把window划分成6*6个小windows，分别提取SIFT特征，然后连接着36个sift特征向量成为图像的特征。

第二种：先求出一个固定的脸的平均shape（27个特征点的位置，比如眼睛左边，嘴唇右边等等），然后以这27个特征点为中心提取sift特征，然后连接后作为特征。

第三种：用他们组去年的另一个成果Face Alignment at 3000 FPS via Regressing Local Binary Features (CVPR14) ，也就是图中的3000FPS方法，回归出每张脸的shape，然后再以每张脸自己的27个shape points为中心做sift，然后连接得到特征。

3.分类：将上述的三种特征分别扔到线性SVM中做分类，训练出一个能分辨一张图是不是脸的SVM模型。

紧接着作者将以上三种方法做出的分类器和初始分类器进行比对，画了一个样本分布的图：