特征提取——HOG方向梯直方图

最新推荐文章于 2024-05-20 13:43:41 发布

勉旃

最新推荐文章于 2024-05-20 13:43:41 发布

阅读量1.9k

点赞数 1

分类专栏：图像处理

本文链接：https://blog.csdn.net/yushupan/article/details/78994754

版权

图像处理专栏收录该内容

5 篇文章 0 订阅

订阅专栏

1、简介
HOG（Histogram of Oriented Gridients的简写）特征检测算法，最早是由法国研究员Dalal等在CVPR-2005上提出来的，一种解决人体目标检测的图像描述子，是一种用于表征图像局部梯度方向和梯度强度分布特性的描述符。其主要思想是：在边缘具体位置未知的情况下，边缘方向的分布也可以很好的表示行人目标的外形轮廓。
2、检测步骤
HOG特征检测算法的几个步骤：颜色空间归一化—>梯度计算—>梯度方向直方图—>重叠块直方图归一化—>HOG特征。
这里写图片描述
2.1、颜色空间归一化
由于图像的采集环境、装置等因素，采集到的人脸图像效果可能不是很好，容易出现误检或漏检的情况，所以需要对采集到的人脸进行图像预处理，主要是处理光线太暗或太强的情况，这里有两次处理：图像灰度化、Gamma校正。
①图像灰度化
对于彩色图像，将RGB分量转化成灰度图像，其转化公式为：
这里写图片描述
②Gamma校正
在图像照度不均匀的情况下，可以通过Gamma校正，将图像整体亮度提高或降低。在实际中可以采用两种不同的方式进行Gamma标准化，平方根、对数法。这里我们采用平方根的办法，公式如下（其中γ=0.5）：
这里写图片描述

2.2、梯度计算
对经过颜色空间归一化后的图像，求取其梯度及梯度方向。分别在水平和垂直方向进行计算，梯度算子为：
这里写图片描述

gamma和梯度代码：
/*****************************************
Copyright (c) 2015 Jingshuang Hu
@filename:demo.cpp
@datetime:2015.08.06
@author:HJS
@e-mail:eleftheria@163.com
@blog:http://blog.csdn.net/hujingshuang
*****************************************/
#include <iostream>
#include <cv.h>
#include <opencv2/core/core.hpp>
#include <opencv2/highgui/highgui.hpp>
#include <opencv2/imgproc/imgproc.hpp>

using namespace cv;
using namespace std;
int main()
{
    Mat picture = imread("test.jpg", 0);//灰度
    Mat img;

    picture.convertTo(img, CV_32F); //转换成浮点
    sqrt(img, img);                 //gamma校正
    normalize(img, img, 0, 255, NORM_MINMAX, CV_32F);//归一化[0,255]浮点数

    Mat gradient = Mat::zeros(img.rows, img.cols, CV_32F);//梯度
    Mat theta = Mat::zeros(img.rows, img.cols, CV_32F);//角度

    for (int i = 1; i < img.rows - 1; i++)
    {
        for (int j = 1; j < img.cols - 1; j++)
        {
            float Gx, Gy;

            Gx = img.at<float>(i, j + 1) - img.at<float>(i, j - 1);
            Gy = img.at<float>(i + 1, j) - img.at<float>(i - 1, j);

            gradient.at<float>(i, j) = sqrt(Gx * Gx + Gy * Gy);//梯度模值
            theta.at<float>(i, j) = float(atan2(Gy, Gx) * 180 / CV_PI);//梯度方向[-180°，180°]
        }
    }

    normalize(gradient, gradient, 0, 255, NORM_MINMAX, CV_8UC1);//归一化[0,255] 无符号整型
    normalize(img, img, 0, 255, NORM_MINMAX, CV_8UC1);

    imshow("原图", picture);
    imshow("Gamma校正", img);
    imshow("梯度图", gradient);
    waitKey();

    return 0;
}

2.3、梯度方向直方图
将图像划分成若干个cells（单元），8x8=64个像素为一个cell，相邻的cell之间不重叠。在每个cell内统计梯度方向直方图，将所有梯度方向划分为9个bin（即9维特征向量），作为直方图的横轴，角度范围所对应的梯度值累加值作为直方图纵轴，每个bin的角度范围如下。
这里写图片描述
2.4、重叠块直方图归一化
HOG的图像分割策略，一般来说有overlap和non-overlap两种。overlap指的是分割出的区块（patch）互相交叠，有重合的区域。non-overlap指的是区块不交叠，没有重合的区域。这两种策略各有各的好处。先说overlap，这种分割方式可以防止对一些物体的切割，以眼睛为例，如果分割的时候正好把眼睛从中间切割并且分到了两个patch中，提取完HOG特征之后，这会影响接下来的分类效果，但是如果两个patch之间overlap，那么至少在一个patch会有完整的眼睛。overlap的缺点是计算量大，因为重叠区域的像素需要重复计算。再说non-overlap，缺点就是上面提到的，有时会将一个连续的物体切割开，得到不太“好”的HOG特征，优点是计算量小，尤其是与Pyramid（金字塔）结合时，这个优点更为明显。

假设有一幅图像大小为220x310，将其划分成若干个8x8的cells，显然220÷8=27.5、310÷8=38.75不是整数，也就是说划分之后依然还有多余像素不能构成cell。处理办法是将图像缩放成能被8整除的长宽（如216x304），再划分。216÷8=27，304÷8=38，因此，216x304的图像可以得到27x38个cells，没有重叠。
由于图像中光照情况和背景的变化多样，梯度值的变化范围会比较大，因而良好的特征标准化对于检测率的提高相当重要。标准化的方法多种多样，大多数的都是将celll放在block中，然后标准化每个block。
以上述缩放后的图像为例，共得到27x38个cell，也就是将图像划分成了27x38个单元；将上下左右相邻的2x2个cells当做一个block整体，如下所示（为方便观察，每个颜色框故意错开了一点），黑色的8x8像素为一个cell，红、蓝、黄、粉红、绿框都是一个block，即每个框内2x2的cell组成一个block。故27x38个cell可划分成26x37个block，每个block为16x16像素。相邻block之间是有重叠的，这样有效的利用了相邻像素信息，对检测结果有很大的帮助。
这里写图片描述

接下分别对每个block进行标准化，一个block内有4个cell，每个cell含9维特征向量，故每个block就由4x9=36维特征向量来表征。
这里写图片描述
由于L2-norm简单且在检测中效果相对较好，故一般采用它。

经过上述对有重叠部分block的直方图归一化之后，将所有block的特征向量都组合起来，则形成26x37x36=34632维特征向量，这就是HOG特征，这个特征向量就可以用来表征整个图像了。
实际上，在运用的时候，我们通常是选取一幅图像中的一个窗口来进行特征提取，依然以上述220X310大小图像为例，经过缩放处理后为216x304，但并不直接提取整个图像的HOG特征，而是用一个固定大小的窗口在图像上滑动，滑动的间隔为8个像素，opencv中默认的窗口大小为128x64（高128，宽64），即有(128÷8)x(64÷8)=16x8个cell，也即有15x7个block，这样一来一幅图像就可以取到(27-16)x(38-8)=11x30=330个窗口。现在提取每个窗口的HOG特征，则可得到105x36=3780维HOG特征向量。
将这330个3780维的HOG特征当做测试样本，用支持向量机（SVM）分类器来判别出，这些窗口的HOG特征是否有行人，有行人的用矩形框标记起来。HOG行人特征及所对应的SVM分类器的参数，在opencv中已经训练好了，我们只需要得到HOG特征，然后调用SVM即可得到判别结果。

参考：
http://blog.csdn.net/hujingshuang/article/details/47337707/
http://blog.sina.com.cn/s/blog_60e6e3d50101bkpn.html
https://www.cnblogs.com/hrlnw/archive/2013/08/06/2826651.html