人脸特征点定位方法综述 (An Empirical Study of Recent Face Alignment Methods阅读笔记)

人脸特征点定位方法综述

(An Empirical Study of Recent Face Alignment Methods阅读笔记)

人脸特征点定位方法具有里程碑式的发展有五个:

1、1995 年Cootes 的ASM算法;

2、1998 年Cootes 的AAM算法;

3、2006 年cristinacce 的CLM算法(Constrained Local Model);

4、2010 年Dollar 的cascaded Regression算法;

5、2013年 Sun 首次将深度学习方法CNN应用到人脸特征点定位上;

 

当前的人脸特征点定位有三种方法:基于局部方法(local-basedmethods)、基于全局的方法(holistic-basedmethods)以及基于混合的方法。注:ASM,AAM不包括在内;

一、基于局部方法(local-based methods)

基于局部方法通常有两种:local expert和spatial shape model .前者着重描述特征点附近图像的“模样”,后者着重于描述脸部形状的变化。

1.1、Local expert主要由以下三类:1)基于分类方法,例如一般基于Gabor特征或SIFT特征的SVM,基于DRMF的字典学习(Dict.L)和多通道关联滤波器(CF);

2)基于回归的方法,例如支持向量回归(SVR)和连续条件随机场(CCNF);

3)基于投票的方法。

1.2、Shape model比较典型的就是CLM(局部约束模型),还有其他的比如RANSAC,图匹配,高斯牛顿可变性部分模型(GNDPM),混合树模型以及层次可能性模型(HPM)

基于局部方法不足之处:1)当特征点较多是,计算量大;2)难以平衡局部响应与全局约束;


二、基于全局的方法(holistic-based methods)

当前大多数基于全局的方法都是从粗到精的方式进行工作的。比如形状估计一般开始与初始形状S0,通过T个回归器级联逐步地对形状进行微调,然后获得最终形状。可以用如下算法进行解释:


尽管当前提出了许多策略,但大多数策略都是基于上面的那个框架,只不过这些方法的区别主要在这三个方面:1)初始化设置不同;2)shape-indexed特征不同;3)回归器的不同;不过特征提取和回归器通常是相互依赖的。

初始化:对于基于形状回归的方法初始化主要有三种策略:random,mean shape以及supervised。这里说一下,基于supervised初始化策略通常通过一个辅助模型(比如ConvNet)计算初始化模型。

Shape indexed特征:当前有大量的不同的图像特征用来作为Shape indexed特征,包括灰度像素差值,手工特征(SIFT或HOG等),学习特征(使用自编码器或ConvNet)

回归器:回归器也有许多不同的构建方法,比如:随机厥 random ferns,随机森林random forests,支持向量回归SupportVector Regressor,监督梯度下降法Supervised Descent Method(SDM) 以及他的扩展方法。当前,也有许多人将深度学习的框架应用到人脸对齐的问题上,这种方法一般都是一种基于全局的(holistic),从粗到精(coarse-to-fine)的方式。


值得注意的是,特征和回归器的结合无非就是两种,non-linear features + linear regression以及linear features + non-linear regression,这是因为从image到face pose的mapping过程就是一个非线性的过程。

三、基于混合的方法

基于混合的方法用的比较多的就是脸部遮挡检测occlusion detection,unified face detection andalignment 以及Active Pictorial Model。

四、人脸特征点定位常用数据集



五、人脸检测方法

(1)OpenCV自带的基于Harr特征的V-Jdetector;

(2)基于HOG+SVM特征的dlib;

(3)doppia库的三种人脸检测方法(DPM,HeadHunter和HeadHunter_baseline)。

上面几种人脸检测效果中doppia库提供的人脸检测效果最好,顺便提一下,doppia库除了有比较好的人脸检测算法之外还有行人检测算法DPM, DPM应该算是的传统机器学习模式(非深度学习)下行人检测效果最好的算法。另外下面是一些网友整理的具有state-of-the-art的人脸检测方法:


文章中有对常用的几种人脸检测算法进行对比:



六、特征点定位评估指标

这里就着重介绍一下作者提出的new特征点定位评估标准: 。当前使用的最多的特征点定位误差归一化的方法就是:


这里表示估计形状与ground truth形状的欧式距离,表示双眼距离,即两眼中心的欧式距离。

评估特征点定位评估方法有两种,一种是平均误差,另一种是累积误差分布曲线(CED,CumulativeError Distribution)。

作者在文章中提出了一种新的人脸特征点定位估计评估指标就是通过计算该曲线的面积进行评估。


这里,e表示归一化误差,f(e)表示累积误差分布函数。


横坐标表示归一化误差值e,纵坐标表示小于归一化误差e的特征点占所有特征点的比例。值得一说的是,该方法的好处就在于的值不像平均误差那样受单个点误差较大而发生较大变化,非常敏感。

七、实验

作者对近年来一些的一些人脸特征点定位方法进行相关的复现性实验并对比其实验效果。这些方法包括CFAN,RCPR,IFA,CFSS,SDM,LBF等等。




注:上述实验结果只是作者实现的效果并非方法原作者所提供的实验数据,而且部分实验结果与方法原作者的存在出入。

重要影响因素

作者在文章研究了许多影响特征点定位效果的因素,比如人脸检测方法(faceCentre shift, face scale change),初始化以及级联程度等等。我在这里就介绍一下文章中介绍的两个重要因素。作者选取了基于全局(holistic-based)的人脸对齐方法的两个重要影响因素:初始化(initialization)和和级联程度(cascade level),选择的研究对象是具有突破性的人脸对齐方法---显性性状回归(ESR)。


上面RD(random)表示随机选取形状,MS(means shape)表示平均形状。

 

  • 6
    点赞
  • 43
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
提供的源码资源涵盖了安卓应用、小程序、Python应用和Java应用等多个领域,每个领域都包含了丰富的实例和项目。这些源码都是基于各自平台的最新技术和标准编写,确保了在对应环境下能够无缝运行。同时,源码中配备了详细的注释和文档,帮助用户快速理解代码结构和实现逻辑。 适用人群: 这些源码资源特别适合大学生群体。无论你是计算机相关专业的学生,还是对其他领域编程感兴趣的学生,这些资源都能为你提供宝贵的学习和实践机会。通过学习和运行这些源码,你可以掌握各平台开发的基础知识,提升编程能力和项目实战经验。 使用场景及目标: 在学习阶段,你可以利用这些源码资源进行课程实践、课外项目或毕业设计。通过分析和运行源码,你将深入了解各平台开发的技术细节和最佳实践,逐步培养起自己的项目开发和问题解决能力。此外,在求职或创业过程中,具备跨平台开发能力的大学生将更具竞争力。 其他说明: 为了确保源码资源的可运行性和易用性,特别注意了以下几点:首先,每份源码都提供了详细的运行环境和依赖说明,确保用户能够轻松搭建起开发环境;其次,源码中的注释和文档都非常完善,方便用户快速上手和理解代码;最后,我会定期更新这些源码资源,以适应各平台技术的最新发展和市场需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值