最近做图像检索,发现倒排文件里边也大有文章。倒排文件对于检索性能没有影响,它只有一个作用,就是加速。
举个例子:
有两本书,两本书里的内容分别是:
Book1: 语文 语文 语文 语文 语文
数学 数学 数学
英语 英语
Book2: 语文 语文 语文
数学 数学 数学 数学
英语 英语 英语 英语
则它们的顺排文件:
Book1: {语文,5}, {数学,3}, {英语,2}
Book2: {语文,2}, {数学,4}, {英语,4}
则它们的倒排文件:
语文: {book1,5}, {book2,3}
数学: {book1,3}, {book2,4}
英语: {book1,2}, {book2,4}
倒排文件在图像检索中的应用:
设有一个图片库D={img1,img2,…imgN},对图片库中的所有图片,都提取它们的特征点(SIFT),然后对特征点进行聚类,形成visual word。把每个图片当成上述例子中的book,把每个visual word当成上述例子中的字,以visual word为索引条目,构建倒排文件。如下图: