基于SDM的人脸特征点检测

最新推荐文章于 2020-04-09 21:39:51 发布

Bartopt

最新推荐文章于 2020-04-09 21:39:51 发布

阅读量2.3k

点赞数 1

分类专栏： Course project 文章标签： Optimize Face alignment

本文链接：https://blog.csdn.net/pH646463981/article/details/80715693

版权

Course project 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

本文来自： http://www.haopeng233.top/2018/06/13/SDM/

欢迎大家访问：）

视频监控课程上选做的大作业，基于SDM的人脸特征点检测。人脸特征点检测是人脸检测后的再处理，为人脸识别提供基础。

参考博客：https://blog.csdn.net/xiamentingtao/article/details/47306887

论文作者主页：http://xiong828.github.io/sdm.html

代码地址：https://github.com/xiamenwcy/impSDM/tree/dev1

算法原理

具体原理以及公式推导在论文以及博客中说的很详细了，我就不再重复了，主要讲一下我对SDM的理解。

机器学习中一般解决优化问题是为了得到分类器或回归器的最优参数，然后使用训练好的分类器或回归器完成对新样本分类或回归的任务。比如神经网络就是一个非线性函数，网络节点的连接权值就是模型的参数，通过最小化$Loss$可以得到最佳权值，测试样本来时正向传播就可以对其分类或者回归。

机器学习的目的是通过对训练样本的学习，使得模型在测试样本上能取得较好的效果，也就是泛化误差小。以神经网络做分类任务为例，说明SDM方法与它的不同。它们都是追求泛化误差最小，但神经网络属于有参模型，它从训练样本中学到了模型的最优参数，测试样本只要正向传播就可以满足泛化误差最小这个最优化问题，有参模型的假设是训练误差最小测试误差就最小，因此测试时可以不更新。SDM属于无参方法，它直接优化$X$（人脸特征点）位置，每个测试样本到来时它都在解决一个新的优化问题，它从训练样本中学习到了解优化问题的过程。它的回归模型嵌套在最优化问题的子问题下。

以人脸特征点检测为例，SDM学会自变量在不同情况下该如何移动以保证优化问题的Loss降低，它学习一个映射$R$，$R$可以将点描述子的特征向量$Φ$映射到$Δx$。假设第10点是眼角，通过训练可以得到$R$，$R$矩阵中对应第10点的那一列可以根据第10点的描述子（可以是SIFT、HOG等），映射得到$Δx$，如果10点在脸上，此时描述子为$ Φ1 $，$ R×Φ1 $会得到Δx向眼睛方向移动，反之，如果10点在眼球上，此时描述子为$Φ2$，$R×Φ2$会得到Δx向远离眼睛方向移动。

SDM学习特定问题的优化过程，通过训练样本学得descent direction。测试样本到来时，仍是在解决优化问题，不过使用学习到的descent direction来解决新的优化问题，用级联回归模型完成优化任务。

那SDM是如何学习优化过程得到$R$的？优化过程本来是用Jacobi或hessian（论文中把这里记为$R$）和残差求$Δx$，但人脸特征点检测中训练样本的$Δx$已知，残差也已知，那么就可以反过来学习Jacobi或hessian（也就是$R$）。$Δx$就是监督信息。从机器学习来看，三大要素，数据、模型、策略。数据为$（Φ，Δx）$（特征向量，偏移量）；模型为线性模型$Δx=R×Φ$，策略是最小二乘。解决完该问题后得到$R_0$，将数据代入得到新的数据，然后可得到一系列的$R_k$。用级联回归的想法完成。