一、HOG简介
方向梯度直方图(Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。Hog特征结合SVM分类器已经被广泛应用于图像识别中,尤其在行人检测中获得了极大的成功。需要提醒的是,HOG+SVM进行行人检测的方法是法国研究人员Dalal在2005的CVPR上提出的,而如今虽然有很多行人检测算法不断提出,但基本都是以HOG+SVM的思路为主。
二、图像预处理
包括伽马校正和灰度化(可选步骤),因为实验证明做不做影响不大。伽马校正是减少光度对实验的影响。灰度化是将彩色图片变成灰度图。其实彩色图片也可以直接处理。不过是分别对三通道的颜色值进行梯度计算,最后选择梯度最大的那个。就不能得到保证)。
三、计算梯度值和方向
对于像素点A,要计算水平梯度和竖直梯度,如上图,水平梯度 =30-20=10,竖直梯度 =64-32=32.
总的梯度强度值g和梯度方向 将按照以下公式计算:
梯度方向将会取绝对值,因此梯度方向的范围是0-180度。取绝对值的原因是这样效果更好。
四、计算梯度直方图
(1) 计算cell直方图
假如梯度直方图的cell大小是8*8,那么在这个cell里面就会有8*8*2=128个值,其中2是包括了梯度强度和梯度方向。通过统计形成梯度直方图,128个值将会变成9个值,大大降低了计算量,同时又对光照等环境变化更加地robust。
首先,我将0-180度分成9个区域,分别是0,20,40...160。然后统计每一个像素点所在的区域。请看下图:
左上图是8*8的梯度方向值,右上图是8*8的梯度强度值,下图是9个区域。
先看两个蓝色圈圈。因为蓝圈的方向是80度,大小是2,所以该点就投给80这个bin;
再看两个红色圈圈。因为红色圈圈的方向是10,大小是4,因为10距离0点为10,距离20点为也为10,那么有一半的大小是投给0这个区域,还有一半的大小(即是2)投给20这个区域。
那么统计完64个点的投票数以后,每个区域就会得到一个数值,可以得到一个直方图,在计算机里面就是一个大小为9的数组(cell)。
从上图可以看到,更多的点的梯度方向是倾向于0度和160度,也就是说这些点的梯度方向是向上或者向下,表明图像这个位置存在比较明显的横向边缘。因此HOG是对边角敏感的,由于这样的统计方法,也是对部分像素值变化不敏感的,所以能够适应不同的环境。
(2) 计算block
block是由多个 cell 组合而成的,典型的组合方式是 2x2 个 cell 组成成一个 block。由上图可知,每一个cell的大小是8*8,因此计算的block是9*2*2=36维的向量,对block做归一化处理,但一般采取L2-norm归一化处理方式, 。
常见的归一化处理方法:
比如对于一个(128,64,32)的三维向量来说,模长是
那么归一化后的向量变成了(0.87,0.43,0.22)
图 1 block移动方式
那么对于一个64*128大小的图像,cell的大小是8*8,按照上图的方式提取block,将会有(2*4-1)=7个水平位置和(2*8-1)=15个竖直位可以取得,所以一共有7*15=105个block,整合所有block组成vector描述符,形成一个大的一维vector维度将会是36*105=3780。