Python+OpenCV图像处理（九）——Haar特征描述算子

最新推荐文章于 2025-04-10 19:51:17 发布

清崎教练

最新推荐文章于 2025-04-10 19:51:17 发布

阅读量4.5k

点赞数 2

分类专栏： cv 文章标签： python opencv 计算机视觉

本文链接：https://blog.csdn.net/bosszhao20190517/article/details/107071736

版权

本文详细介绍了Haar特征描述算子在计算机视觉中的应用，特别是在人脸检测领域的贡献。文章阐述了Haar-like特征的理论，包括积分图的计算方法、特征值的归一化以及Adaboost级联分类器的作用。内容涵盖了从特征的计算到级联分类器的训练和检测过程，最后提到了OpenCV中预训练的XML文件及其用途。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

系列文章
Python+OpenCV图像处理（一）——OpenCV框架与图像插值算法
 Python+OpenCV图像处理（二）——几何变换
 Python+OpenCV图像处理（三）——彩色空间互换
 Python+OpenCV图像处理（四）——图像滤波
 Python+OpenCV图像处理（五）——图像阈值和二值化
 Python+OpenCV图像处理（六）——边缘检测
 Python+OpenCV图像处理（七）——Harris特征点检测
 Python+OpenCV图像处理（八）——LBP特征描述算子

九、Haar特征描述算子

8.1 简介

Haar-like特征最早是由Papageorgiou等应用于人脸表示，在2001年，Viola和Jones两位大牛发表了经典的《Rapid Object Detection using a Boosted Cascade of Simple Features》和《Robust Real-Time Face Detection》，在AdaBoost算法的基础上，使用Haar-like小波特征和积分图方法进行人脸检测，他俩不是最早使用提出小波特征的，但是他们设计了针对人脸检测更有效的特征，并对AdaBoost训练出的强分类器进行级联。这可以说是人脸检测史上里程碑式的一笔了，也因此当时提出的这个算法被称为Viola-Jones检测器。又过了一段时间，Rainer Lienhart和Jochen Maydt两位大牛将这个检测器进行了扩展，最终形成了OpenCV现在的Haar分类器。

8.2 算法理论

8.2.1 Haar-like 特征

Haar-like 特征因为与哈尔小波转换极为相似而得名，是第一种即时的人脸检测运算。

Haar(哈尔)特征分为三类：边缘特征、线性特征、中心特征和对角线特征，组合成特征模板。特征模板内有白色和黑色两种矩形，并定义该模板的特征值为白色矩形像素和减去黑色矩形像素和。Haar特征值反映了图像的灰度变化情况。

例如：脸部的一些特征能由矩形特征简单的描述，如：眼睛要比脸颊颜色要深，鼻梁两侧比鼻梁颜色要深，嘴巴比周围颜色要深等。但矩形特征只对一些简单的图形结构，如边缘、线段较敏感，所以只能描述特定走向（水平、垂直、对角）的结构。

对于图中的A, B和D这类特征，特征数值计算公式为：v=Σ白-Σ黑，而对于C来说，计算公式如下：v=Σ白-2*Σ黑；之所以将黑色区域像素和乘以2，是为了使两种矩形区域中像素数目一致。我们希望当把矩形放到人脸区域计算出来的特征值和放到非人脸区域计算出来的特征值差别越大越好，这样就可以用来区分人脸和非人脸。

通过改变特征模板的大小和位置，可在图像子窗口中穷举出大量的特征。上图的特征模板称为“特征原型”；特征原型在图像子窗口中扩展（平移伸缩）得到的特征称为“矩形特征”；矩形特征的值称为“特征值”。

上图中两个矩形特征，表示出人脸的某些特征。比如中间一幅表示眼睛区域的颜色比脸颊区域的颜色深，右边一幅表示鼻梁两侧比鼻梁的颜色要深。同样，其他目标，如眼睛等，也可以用一些矩形特征来表示。使用特征比单纯地使用像素点具有很大的优越性，并且速度更快。

矩形特征可位于图像任意位置，大小也可以任意改变，所以矩形特征值是矩形模版类别、矩形位置和矩形大小这三个因素的函数。故类别、大小和位置的变化，使得很小的检测窗口含有非常多的矩形特征，如：在24*24像素大小的检测窗口内矩形特征数量可以达到16万个。这样就有两个问题需要解决了：

如何快速计算那么多的特征？—积分图大显神通
哪些矩形特征才是对分类器分类最有效的？—如通过AdaBoost算法来训练。

8.2.2 Haar-like特征的计算—积分图

积分图就是只遍历一次图像就可以求出图像中所有区域像素和的快速算法，大大的提高了图像特征值计算的效率。

积分图主要的思想是将图像从起点开始到各个点所形成的矩形区域像素之和作为一个数组的元素保存在内存中，当要计算某个区域的像素和时可以直接索引数组的元素，不用重新计算这个区域的像素和，从而加快了计算（这有个相应的称呼，叫做动态规划算法）。积分图能够在多种尺度下，使用相同的时间（常数时间）来计算不同的特征，因此大大提高了检测速度。

积分图是一种能够描述全局信息的矩阵表示方法。积分图的构造方式是:位置（𝑖,𝑗）处的值𝑖𝑖(𝑖,𝑗)是原图像(𝑖,𝑗)左上角方向所有像素𝑓(𝑘,𝑙)的和：

$ii(i,j)=\sum_{k≤i,l≤j}f(k,l)$