cvpr11——Image Retrieval with Geometry-Preserving Visual Phrases

Yimeng Zhang, , Zhaoyin Jia, and Tsuhan Chen. “Image Retrieval with Geometry Preserving Visual Phrases” IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR) (oral presentation, 3.5% acceptance rate) , 2011. [pdf]

这篇文章主要在BoV(bag of visual word)基础上加入了spatial信息,提出了GVP[1](Geometry-Preserving Visual Phrases),其基本思想比较简单,如下图所示:


统计两幅图像中,相同的word之间的距离。设定一阈值k,判断offset space平面中每个方格中的word是否大于k,之后统计GPV的个数。例如上图中:

k=1 GVP的个数为8,k=2 GVP=1(B,F)+1(D,F)+3(3 choose 2, for bin with A;B;C)。之后将GPV融入到索引结果中,其结构如下图:


相当于只增加了位置信息即(划分网格的个数)。

结合TF-IDF机制进行检索,同时可以引入MinHash。效果优于[2][3]。该方法只考虑了平移的特性,对于尺度和旋转在[4]同样可以适合该框架。

[1] Yimeng Zhang, Tsuhan Chen. “Efficient Kernels for Identifying Unbounded Order Spatial Features.” IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR), 2009. [pdf]

[2] J. Philbin, O. Chum, M. Isard, J. Sivic, and A. Zisserman. Object retrieval with large vocabularies and fast spatial matching. In CVPR, 2007.

[3] Y. Cao, C. Wang, Z. Li, L. Zhang, and L. Zhang. Spatialbag-of-features. In CVPR, 2010.

[4] Yimeng Zhang, Tsuhan Chen. “Weakly Supervised Object Recognition and Localization with Invariant High Order Features.” British Machine Vision Conference (BMVC), 2010. [pdf]


Yimeng Zhang个人主页:http://chenlab.ece.cornell.edu/people/yimeng/



  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值