金字塔式梯度方向直方图(PHOG)

Pyramid Histogram of Oriented Gradients (PHOG),HOG大家都知道了,其实就是一个模板,每个CELL用方向信息来统计,我其实很久也用过边界方向直方图,只是感觉模板法太狭隘,就没有把边界方向直方图在CELL上求解然后连接成为一个一维向量,其实可以每个CELL看做一个patch,就可以用其他方法来做也行。之所以加入Pyramid,其实将模板方法更加严格的定义下来,这样,复合模板的就会检测的更准确,但是稍微有点旋转什么的就不行了,马上被错误检测,其实加入bias应该能解决问题。源码地址是有名的VGG里的PHOG。下面看个图:

https://i-blog.csdnimg.cn/blog_migrate/205505b04f646127f76656e9b7cf7bbc.jpeg

Spatial Pyramid Matching就不用多讲了,也是将bag of words变换,先求解每一个金字塔小块的,然后连接起来成为一个长的。严格限制了模板的信息,也就是所谓的空间信息,其实这种空间信息是存在图像都是正着存储的假设,例如人都是正着的,不是躺着。代码lazebnik也提供了,但是他的代码不太适合大数据量,因为都是网内存中放的,我稍微改了改,放在这里了:

  • PG_BOW_DEMO: Matlab code for computing the bag of visual words at different levels of spatial pyramid of images.

有兴趣的可以下载使用。

http://www.cs.unc.edu/~lazebnik/images/spatial_pyramid.jpg

这两种特征描述子提取之后,分别求直方图交核函数,这个核函数确实好用点:

k(x,y) = \sum_{i=1}^n \min(x_i,y_i)

这难道就是越来越发现L1 norm比L2 norm好的一个不是很典型的例子?也不知道对不对。L2就是欧式距离吧,L1就是绝对值距离(曼哈顿距离)。

两个核融合的时候选个参数alpa。行了,是不是结果好多了呢?


  • 3
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值