Haar分类器 = Haar特征 + 积分图方法 + AdaBoost +级联强分类器

最新推荐文章于 2024-05-21 08:00:00 发布

Mr_EvanChen

最新推荐文章于 2024-05-21 08:00:00 发布

阅读量3.2k

点赞数 1

分类专栏：机器学习文章标签： Haar分类器 Haar特征积分图 AdaBoost 级联强分类器

机器学习专栏收录该内容

13 篇文章 0 订阅

订阅专栏

1、 Haar分类器

Haar分类器 = Haar特征 + 积分图方法 + AdaBoost + 级联强分类器

Haar分类器算法的要点如下：

①　使用Haar-like特征做检测。

②　使用积分图（Integral Image）对Haar-like特征求值进行加速。

③　使用AdaBoost算法训练区分人脸和非人脸的强分类器。

④　使用筛选式级联把强分类器级联到一起，提高准确率。

2、级联强分类器

关于Haar-like特征和积分图，可以看该博客的：Haar特征与积分图

关于AdaBoost算法，不理解的可以看该博客的：Adaboost（1）——从了解到掌握

这里主要讲一下级联强分类器。我们看到了通过AdaBoost算法辛苦的训练出了强分类器，然而在现实的人脸检测中，只靠一个强分类器还是难以保证检测的正确率，这个时候，需要一个豪华的阵容，训练出多个强分类器将它们强强联手，最终形成正确率很高的级联分类器这就是我们最终的目标Haar分类器。一般学术界所说的级联分类器，都是指的是级联强分类器，一般情况有10个左右的强分类器，每个强分类有10-20个弱分类器。当然每一层的强分类器中弱分类器的个数可以不相等，可以根据需要在前面的层少放一些弱分类器，后面的层次逐渐的增加弱分类器的个数。

级联强分类器的策略是，将若干个强分类器由简单到复杂排列，希望经过训练使每个强分类器都有较高检测率，而误识率可以放低，比如几乎99%的人脸可以通过，但50%的非人脸也可以通过，这样如果有20个强分类器级联，那么他们的总识别率为0.99^20约等于98%，错误接受率也仅为0.5^20约等于0.0001%。这样的效果就可以满足现实的需要了，但是如何使每个强分类器都具有较高检测率呢，为什么单个的强分类器不可以同时具有较高检测率和较高误识率呢？

下面我们讲讲级联分类器的训练。（主要参考了论文《基于Adaboost的人脸检测方法及眼睛定位算法研究》）

设K是一个级联检测器的层数，D是该级联分类器的检测率，F是该级联分类器的误识率，d_i是第i层强分类器的检测率，f_i是第i层强分类器的误识率。如果要训练一个级联分类器达到给定的F值和D值，只需要训练出每层的d值和f值，这样：

d^K = D, f^K = F

级联分类器的要点就是如何训练每层强分类器的d值和f值达到指定要求。

AdaBoost训练出来的强分类器一般具有较小的误识率，但检测率并不很高，一般情况下，高检测率会导致高误识率，这是强分类阈值的划分导致的，要提高强分类器的检测率既要降低阈值，要降低强分类器的误识率就要提高阈值，这是个矛盾的事情。据参考论文的实验结果，增加分类器个数可以在提高强分类器检测率的同时降低误识率，所以级联分类器在训练时要考虑如下平衡，一是弱分类器的个数和计算时间的平衡，二是强分类器检测率和误识率之间的平衡。

具体训练方法如下,我用伪码的形式给出：

1）设定每层最小要达到的检测率d，最大误识率f，最终级联分类器的误识率Ft；

2）P=人脸训练样本，N=非人脸训练样本，D0=1.0，F0=1.0；

3）i=0；

4）for : F_i>F_t

++i;

ni=0;F_i=F_i-1;

for : F_i>f*F_i-1

++n_i;

利用AdaBoost算法在P和N上训练具有n_i个弱分类器的强分类器;

衡量当前级联分类器的检测率Di和误识率Fi;

for : d_i<d*D_i-1;

降低第i层的强分类器阈值;

衡量当前级联分类器的检测率D_i和误识率F_i;

N = Φ;

利用当前的级联分类器检测非人脸图像，将误识的图像放入N;

3、图像检测过程

最后说一下图像的检测过程。在对输入图像进行检测的时候，一般输入图像都会比20*20的训练样本大很多。在Adaboost 算法中采用了扩大检测窗口的方法，而不是缩小图片。为什么扩大检测窗口而不是缩小图片呢，在以前的图像检测中，一般都是将图片连续缩小十一级，然后对每一级的图像进行检测，最后在对检测出的每一级结果进行汇总。然而，有个问题就是，使用级联分类器的AdaBoost的人脸检测算法的速度非常的快，不可能采用图像缩放的方法，因为仅仅是把图像缩放11级的处理，就要消耗一秒钟至少，已经不能达到Adaboost 的实时处理的要求了。

因为Haar特征具有与检测窗口大小无关的特性，所以可以将检测窗口进行级别方法。在检测的最初，检测窗口和样本大小一致，然后按照一定的尺度参数（即每次移动的像素个数，向左然后向下）进行移动，遍历整个图像，标出可能的人脸区域。遍历完以后按照指定的放大的倍数参数放大检测窗口，然后在进行一次图像遍历；这样不停的放大检测窗口对检测图像进行遍历，直到检测窗口超过原图像的一半以后停止遍历。因为整个算法的过程非常快，即使是遍历了这么多次，根据不同电脑的配置大概处理一幅图像也就是几十毫秒到一百毫秒左右。在检测窗口遍历完一次图像后，处理重叠的检测到的人脸区域，进行合并等操作。

4、总结

至此，已经将Haar分类器（Haar特征 + 积分图方法 + AdaBoost + 级联强分类器）的要点全部介绍完毕，下一篇将贴出用Haar分类器进行人脸检测的OpenCV实例代码。

Mr_EvanChen

关注

1
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
Haar分类器 = Haar特征 + 积分图方法 + AdaBoost +级联强分类器

1、 Haar分类器 Haar分类器 = Haar-like特征 + 积分图方法 + AdaBoost +级联 Haar分类器算法的要点如下：①　使用Haar-like特征做检测。②　使用积分图（Integral Image）对Haar-like特征求值进行加速。③　使用AdaBoost算法训练区分人脸和非人脸的强分类器。④　使用筛选式级联
复制链接

扫一扫