基于梯度直方图(HOG)的目标检测

深度学习之前,最成功的检测算法就是基于梯度直方图的目标检测算法,今天主要介绍一些这个算法的步骤:

1、图像预处理(统一亮度,色彩强度)
这样做是为了使图像不要太黑或者太亮,对比度不要太窄

2、计算每一个像素点位置的梯度方向和大小

下图是梯度的计算方式和梯度的可视化:
在这里插入图片描述
从梯度的计算公式可以看出,梯度是带有方向的向量,它有自己的方向和大小,每个像素位置都可以计算自己的梯度,计算方法是,先计算x方向的梯度,即像素值变换,再计算y方向上的梯度,即像素值变换,这两个方向上的变换,组成了一个向量,从左图可以看出,图中心像素值最大,然后以圆的方式均匀减小,因此可以看到,每个像素位置上梯度的大小一样,梯度的方向是指向圆心。右图梯度的方向是水平向左。

3、将图像分为8*8像素的模块,使用HOG计算此模块的向量表达(向量长度为9)
我们将图像分成若干个8x8的小单元,我们计算8x8小单元里每个像素的梯度,然后我们在梯度的方向上做直方图,例如梯度的范围是0到180度之间,然后将这角度分为9个bin,统计8x8小单元中像素梯度方向落到9个bin中的数量。

4、与4个相邻的区域做四次Normalization,将四次Normalization的结果连接为一个长度为36的向量,并且正则化使得其为单位向量

HOG将8x8的一个区域作为一个cell,再以2x2个cell作为一组,称为block,由于每个cell有9个值,2x2个cell有36个值,HOG是通过滑动窗口的方式得到block的。

但是图像的梯度对整体光照非常敏感,aru通过将所有像素值除以2来使图像变暗,那么梯度幅值将减小一半,因此直方图中的值也将减小一半,理想情况下,我们希望我们的特征描述符不会受到光照变化的影响,因此我们就需要将直方图“归一化。

假如我们有一个向量[128, 64, 32], 向量的长度可以计算得到146.64,这叫做向量的L2范数,将这个向量的每个元素都除以146.64,得到了归一化后的向量[0.87, 0.43, 0.22]。你会发现,向量[1282, 642, 32*2]归一化之后的向量也是[0.87, 0.43, 0.22]

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值