Inverted Multi-Index

最新推荐文章于 2024-02-25 21:34:48 发布

南有乔木NTU

最新推荐文章于 2024-02-25 21:34:48 发布

阅读量3.6k

点赞数 3

分类专栏：论文总结

本文链接：https://blog.csdn.net/zijin0802034/article/details/52542314

版权

Inverted Multi-Index简介Inverted Multi-index是Artem Babenko 和 Victor Lempitsky发表的一篇论文，论文起初发表在CVPR2012上，后来又增加了内容，又发表在2014的PAMI上，被引用的次数很高。论文地址如下所示： CVPR2012 PAMI 2014引言分析整篇文章，总结下来想法还是很直观。首先分析传统的倒排索引，在传统

摘要由CSDN通过智能技术生成

Inverted Multi-Index

简介

Inverted Multi-index是Artem Babenko 和 Victor Lempitsky发表的一篇论文，论文起初发表在CVPR2012上，后来又增加了内容，又发表在2014的PAMI上，被引用的次数很高。
论文地址如下所示：
CVPR2012
PAMI 2014

引言

分析整篇文章，总结下来想法还是很直观。首先分析传统的倒排索引，在传统的倒排索引中，我们这样做：

首先N个M维的数据，首先进行K-means聚类，会生成K个聚类
将原始的每个M维的数据分别和Ｋ个聚类中心进行比较，然后找出距离最小的聚类。
会生成如下所示的索引结构，方框代表聚类中心，圆代表聚类中同一类的数据。

但是原始的倒排索引是在全维度上进行聚类，qurey时候先计算与聚类中心centroids的距离，然后计算centroids内的database与query的距离，避免了O(n)的搜索规模。然而，如果数据比较分散，没有出现明显的数据簇，直接进行聚类，数据将会非常稀疏。导致在查询的过程中，会只关注centroids内的点，然而忽视了实际很近的数据点。如下图所示：

所以，在论文中作者提出了一种新型的索引结构，将原始的数据进行维度划分，然后在各个维度中进行K-means聚类，将database中的数据映射到各个空间的centroids上，query时通过计算数据与database的centroids距离进行排序，返回K个紧邻。进行这种划分，一个最大的优势就是，采用了更精细的子空间划分，提高了检索的召回率。

Iverted Multi-Index

受到product quantization的思想启发，作者将原始的数据Ｎ×Ｍ维数据 $D = \{ p_1, p_2,p_3,.......p_n \}$ ，分别划分为两个Ｎ×Ｍ／２维的数据。假设 $p_i=[p_i^1 ,p_j^1]$ ，其中 $p_i \in R^M$ 。我们现在讲数据集进行划分为两部分， p1i∈RM

最低0.47元/天解锁文章

南有乔木NTU

关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
Inverted Multi-Index

Inverted Multi-Index简介Inverted Multi-index是Artem Babenko 和 Victor Lempitsky发表的一篇论文，论文起初发表在CVPR2012上，后来又增加了内容，又发表在2014的PAMI上，被引用的次数很高。论文地址如下所示： CVPR2012 PAMI 2014引言分析整篇文章，总结下来想法还是很直观。首先分析传统的倒排索引，在传统
复制链接

扫一扫