(Face Alignment) One Millisecond Face Alignment with an Ensemble of Regression Trees 笔记-CSDN博客

本文链接：https://blog.csdn.net/hit_sirius/article/details/79945211

人脸关键点检测，也可以认为是人脸对齐（face alignment）可以采用多种方法进行实现，其中一种比较有代表性的方法是使用回归来完成这一功能。2014年CVPR上“One Millisecond Face Alignment with an Ensemble of Regression Trees”这篇文章是回归方法中的一种，Dlib库中的人脸关键点检测就是依据这一方法进行了实现。

论文主要特点

1，使用级联的回归树（ensemble of regression trees）来实现人脸对齐
2，将此方法拓展使得可以轻易的处理缺失数据
3，在速度和准确率上都得到了很优秀的效果

论文主要方法

此方法与之前的“Cascaded pose regression”和“Face alignment by explicit
shape regression”方法属于同一个类型，其核心都是使用了两层的回归来建立数学模型。

在第一层回归，其迭代公式为：

S^(t + 1) = S^(t) + γ t (I, S^(t))

$\hat{S}^{(t+1)}=\hat{S}^{(t)} +\gamma_t(I,\hat{S}^{(t)})$

其中S是形状向量，存储着所有脸部关键点的位置， $\gamma_t$ 是一层的回归器，其输入为当前的形状向量和训练图片，其输出则是对所有的关键点的位置更新量。可以看到，在第一层的级联回归器中，每经过一级级联回归器，就会对所有关键点位置进行一次更新来达到更正确的位置。

在第二层回归，也就是 $\gamma_t$ 内部也是一次回归的过程，在本篇文章中采用的是Gradient Tree Boosting Algorithm的方法来得到一系列的回归树（Regression Tree)最终完成第二级的回归，需要注意的是，第二级回归的对象是当前预测值和真实值的差值。

第一层回归训练过程

首先，有训练数据集 $(I_1,S_1),...(I_n,S_n)$ ，其中 $I_i$ 图片， $S_i$ 为人脸关键点的位置。
在第一层的回归训练中，数据组织形式可以写为 $(I_{\pi i},\hat{S_{i}}^{(t)},\Delta S_{i}^{(t)})$ ，其中 $I_{\pi i}$ 为数据集中的图片， $\hat{S_{i}}^{(t)}$ 是第一层级联回归的第t层的预测关键点位置， $\Delta S_{i}^{(t)}$ 是这一层回归结果和真实值的差值。
其迭代公式为：