深度学习之前,最成功的检测算法就是基于梯度直方图的目标检测算法,今天主要介绍一些这个算法的步骤:
1、图像预处理(统一亮度,色彩强度)
这样做是为了使图像不要太黑或者太亮,对比度不要太窄
2、计算每一个像素点位置的梯度方向和大小
下图是梯度的计算方式和梯度的可视化:
从梯度的计算公式可以看出,梯度是带有方向的向量,它有自己的方向和大小,每个像素位置都可以计算自己的梯度,计算方法是,先计算x方向的梯度,即像素值变换,再计算y方向上的梯度,即像素值变换,这两个方向上的变换,组成了一个向量,从左图可以看出,图中心像素值最大,然后以圆的方式均匀减小,因此可以看到,每个像素位置上梯度的大小一样,梯度的方向是指向圆心。右图梯度的方向是水平向左。
3、将图像分为8*8像素的模块,使用HOG计算此模块的向量表达(向量长度为9)
我们将图像分成若干个8x8的小单元,我们计算8x8小单元里每个像素的梯度,然后我们在梯度的方向上做直方图,例如梯度的范围是0到180度之间,然后将这角度分为9个bin,统计8x8小单元中像素梯度方向落到9个bin中的数量。
4、与4个相邻的区域做四次Normalization,将四次Normalization的结果连接为一个长度为36的向量,并且正则化使得其为单位向量
HOG将8x8的一个区域作为一个cell,再以2x2个cell作为一组,称为block,由于每个cell有9个值,2x2个cell有36个值,HOG是通过滑动窗口的方式得到block的。
但是图像的梯度对整体光照非常敏感,aru通过将所有像素值除以2来使图像变暗,那么梯度幅值将减小一半,因此直方图中的值也将减小一半,理想情况下,我们希望我们的特征描述符不会受到光照变化的影响,因此我们就需要将直方图“归一化。
假如我们有一个向量[128, 64, 32], 向量的长度可以计算得到146.64,这叫做向量的L2范数,将这个向量的每个元素都除以146.64,得到了归一化后的向量[0.87, 0.43, 0.22]。你会发现,向量[1282, 642, 32*2]归一化之后的向量也是[0.87, 0.43, 0.22]