人脸对齐之SDM(Supervised Descent Method)

最新推荐文章于 2021-09-03 16:18:24 发布

原创最新推荐文章于 2021-09-03 16:18:24 发布 · 1w 阅读

16 ·

CC 4.0 BY-SA版权

人脸关键点检测&对齐专栏收录该内容

17 篇文章

订阅专栏

SDM（Supervised Descent Method）是一种有效解决非线性最小化问题的方法，尤其适用于人脸对齐中的关键点回归任务。该方法通过简化计算过程，避免了复杂的Hessian矩阵计算，同时保证了算法的收敛性。在实际应用中，SDM能够快速准确地估计人脸的姿态，如yaw、roll和pitch角度。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

SDM(Supervised Descent Method)是一种监督下降方法，属于解决非线性最小化NLS(Non-linear Least Squares)问题的一种方法。

解决非线性最优化问题通常有2个难点，

（1）方程不可微，或者计算量太大

（2）Hessian矩阵太大，或者不是正定矩阵

基于这样的难点，作者提出了自己的SDM方法，可以用于解决上述的问题，并成功的用次方法解决了人脸对齐中关键点的回归问题，取得了state-of-the-art的效果。

一个传统和奏效的解决最小化二乘问题的方法就是牛顿下山法，正如，上面左图所示，通过牛顿迭代，最终可以找到一个全局最小值。这样的迭代也肯定是效果最好的，但是在实际工程应用中，是不会有足够的计算资源来将所有样本一下都计算进去的，于是就有了上面右图的方法，更新每一个daerta(x)，每次都会找到一个最小值，然后不断迭代，减少最小值之间的误差距离，最终就会找到全局最小值，类似深度学习里的Mini batch SGD，就像吴恩达视频中讲的，虽然没有理论的证明，局部最小值就是全局最小值，但是很多实际的经验告诉我们，最后，只能收敛到一个最小值，也就是说，很多现实实际问题是只有一个最小值的。

ps:还是很喜欢这个图中的牛顿，高斯和拉格朗日。

SDM推导：

SDM的过程就是最小化上面函数的过程，其中，

d为m*1维，表示有m个像素，

d(x)为p*1维，表示p个Landmarks，

h为非线性的特征提取函数，提取的sift特征h(d(x))为128p维

将上式子进行泰勒展开变为了下面的式子，

第一次初始化det(x1)按下式计算，

初始化时，第一次对于det(fai)的计算，可以看成det(fai)到R0的投影，因此，也可以近似的将R0看成是梯度方向。

由于将R0近似为梯度方向，所以det由上面的非线性问题转化为下面式子的线性问题，

整个的训练过程就是求一个最佳的R0和b0的过程，来保证det最小。最终也就将递推公式由下面的第一个式子转化为下面的第二个式子，也就不需要hession矩阵和Jacobian矩阵的计算了。实现了由2次问题到1次问题的转化，但是2次问题肯定会收敛，1次的则很难保证，因此，作者引入了fai(k)这个一系列的特征向量，而不是上式一样，只有一个fai(0)，从而来保证收敛，实验过程中，迭代4-5次后就会收敛。