openCV特征提取与检测（六）-- HOG特征检测算法

最新推荐文章于 2025-04-10 21:55:37 发布

DIAJEY

最新推荐文章于 2025-04-10 21:55:37 发布

阅读量9.1k

点赞数 15

分类专栏： openCV 文章标签：计算机视觉

本文链接：https://blog.csdn.net/DIAJEY/article/details/108283262

版权

1.什么是HOG特征提取算法？

Hog，即方向梯度直方图
在这里插入图片描述
直方图就是数据分布的一种图形表现，类似于柱形图，每个柱形代表一组处于一定范围的数据。这些柱形也成为组（bins），柱形越高意味着某组数据越多

以下图灰度图像为例
在这里插入图片描述
像素值的范围在0-255之间，将这些值分为32组，每组包含8个像素值，所以第一组的范围是0-7，以此类推到248-255.

要创建直方图，就是将该途中的各个像素值，放到对应的组里。而上图中的薄饼有很多亮值，背景则很黑，因此直方图大致如下：
在这里插入图片描述
什么是方向梯度？
方向很简单，指的就是图像梯度的方向或朝向。Hog就是一张有关图像梯度方向的直方图。首先HOG会接受一张图像，然后计算每个像素的梯度幅度和方向

Hog会把这些像素分成若干个较大的正方形单元，单元通常是8X8，如果图片小一些，单元就响应小一些，8X8即有64个梯度值，HOG会计算每个单元相同方向的梯度有多少，将这些梯度的幅值相加得到梯度强度。并将所有方向数据放到直方图中。以下直方图有9组，也就是9个值范围。
在这里插入图片描述
HOG会对图像的每个单元进行同样的处理，这个方向梯度直方图实际上就是个特征向量。对于物体相同但大小，方向不同的图像，可以利用HOG特征模式来检测物体，而不
管物体的位置和呈现方式。

2.在openCV中如何实现HOG算法？

正如在 ORB 算法中看到的，我们可以使用图像中的关键点进行匹配，以检测图像中的对象。当想要检测具有许多一致的内部特性且不受背景影响的对象时，这些类型的算法非常有用。例如，这些算法在人脸检测中可以取得良好的效果，因为人脸有许多不受图像背景影响的一致的内部特征，例如眼睛、鼻子和嘴巴。然而，当试图进行更一般的对象识别时，例如图像中的行人检测时，这些类型的算法并不能很好地工作。原因是人们的内在特征不像脸那样一致，因为每个人的体型和风格都不同（见下图）。这意味着每个人都会有一套不同的内部特征，因此我们需要一些能够更全面地描述一个人的东西。
在这里插入图片描述

一种选择是尝试通过行人的轮廓来检测他们。通过图像的轮廓（边界）来检测物体是非常具有挑战性的，因为我们必须处理背景和前景之间的对比带来的困难。例如，假设想检测一个图像中的行人，她正走在一栋白色建筑前，穿着白色外套和黑色裤子。我们可以在下图中看到，由于图像的背景大多是白色，黑色裤子的对比度将非常高，但由于外套也是白色的，所以对比度将非常低。

在这种情况下，检测裤子的边缘是很容易的，但是检测外套的边缘是非常困难的。而这就是为什么需要 HOG 。即定向梯度柱状图（Histograms of Oriented Gradients），它是由 Navneet Dalal 和 Bill Triggs 于 2005 年首次引入的。
在这里插入图片描述
Hog 算法的工作原理是创建图像中梯度方向分布的柱状图，然后以一种非常特殊的方式对其进行归一化。这种特殊的归一化使得Hog 能够有效地检测物体的边缘，即使在对比度很低的情况下也是如此。这些标准化的柱状图被放在一个特征向量（称为 HOG 描述符）中，可以用来训练机器学习算法，例如支持向量机（SVM），以根据图像中的边界（边）检测对象。由于它的巨大成功和可靠性，HOG 已成为计算机视觉中应用最广泛的目标检测算法之一。