Haar特征

最新推荐文章于 2021-01-21 14:47:28 发布

恬淡-激昂

最新推荐文章于 2021-01-21 14:47:28 发布

阅读量1k

点赞数

分类专栏：人脸识别文章标签： Haar特征

人脸识别专栏收录该内容

3 篇文章 0 订阅

订阅专栏

综合 http://www.cnblogs.com/dylantsou/archive/2012/08/11/2633483.html

和 http://zhidao.baidu.com/link?url=c3oQDIpI2De8z9oXApLl50Wpgev8FnwrwlVsdOqp5wAKwHAZDT9FvbikwakXJgtApJZFZRMNJ1UP5nWH_9WiNa

Haar-like特征最早是由Papageorgiou等应用于人脸表示，Viola和Jones在此基础上，使用3种类型4种形式的特征。

Haar特征分为三类：边缘特征、线性特征、中心特征和对角线特征，组合成特征模板。特征模板内有白色和黑色两种矩形，并定义该模板的特征值为白色矩形像素和减去黑色矩形像素和。Haar特征值反映了图像的灰度变化情况。例如：脸部的一些特征能由矩形特征简单的描述，如：眼睛要比脸颊颜色要深，鼻梁两侧比鼻梁颜色要深，嘴巴比周围颜色要深等。但矩形特征只对一些简单的图形结构，如边缘、线段较敏感，所以只能描述特定走向（水平、垂直、对角）的结构。

对于图中的A, B和D这类特征，特征数值计算公式为：v=Sum白-Sum黑，而对于C来说，计算公式如下：v=Sum白-2*Sum黑；之所以将黑色区域像素和乘以2，是为了使两种矩形区域中像素数目一致。

通过改变特征模板的大小和位置，可在图像子窗口中穷举出大量的特征。上图的特征模板称为“特征原型”；特征原型在图像子窗口中扩展（平移伸缩）得到的特征称为“矩形特征”；矩形特征的值称为“特征值”。

矩形特征可位于图像任意位置，大小也可以任意改变，所以矩形特征值是矩形模版类别、矩形位置和矩形大小这三个因素的函数。故类别、大小和位置的变化，使得很小的检测窗口含有非常多的矩形特征，如：在24*24像素大小的检测窗口内矩形特征数量可以达到16万个。

=============================================================================================================

一、AdaBoost算法原理

　　AdaBoost算法是一种迭代的算法，对于一组训练集，通过改变其中每个样本的分布概率，而得到不同的训练集Si，对于每一个Si进行训练从而得到一个弱分类器Hi，再将这些若分类器根据不同的权值组合起来，就得到了强分类器。

　　第一次的时候，每个样本都是均匀分布，通过训练得到分类器H_0，在该训练集中，分类正确的，就降低其分布概率；分类错误的，就提高其分布概率，这样得到的新的训练集S1就主要是针对不太好分类的样本了。再使用S1进行训练，得到分类器H1，依次迭代下去……，设迭代此外为T，则得到T个分类器。

　　对于每个分类器的权值，其分类准确性越高，权值越高。

二、Haar特征

　　2.1 特征样子

　　就是一些矩形特征的模板，在viola&Jones的论文中，有下面这五种

在opencv中的方法中，有下面这14种，

　　2.2 特种的个数

　　对于一个给定的24X24的窗口，根据不同的位置，以及不同的缩放，可以产生超过160,000个特征。

　　2.3 特征计算方法——积分图

　　有点类似于动态规划的思想，一次计算，多次使用

　　对应于两矩形特征2，矩阵A的值可以用i(5)+ii(1)-ii(4)-ii(2)表示，矩阵B的值用ii(6)+ii(2)-ii(3)-ii(5)表示

　　根据定义，haar特征的值为白色矩形减去黑色矩形的值。

三、选取弱分类器

　　一个弱分类器，实际上就是在这160,000+的特征中选取一个特征，用这个特征能够区分出人脸or非人脸，且错误率最低。

　　现在有人脸样本2000张，非人脸样本4000张，这些样本都经过了归一化，大小都是24X24的图像。那么，对于160,000+中的任一特征f_i，我们计算该特征在这2000人脸样本、4000非人脸样本上的值，这样就得到6000个特征值。将这些特征值排序，然后选取一个最佳的特征值，在该特征值下，对于特征f_i来说，样本的加权错误率最低。选择160,000+个特征中，错误率最低的特征，用来判断人脸，这就是一个弱分类器，同时用此分类器对样本进行分类，并更新样本的权重。

　　具体过程如下：

　　1. 归一化权重：