是牛津视觉组2013年发表在CVPR上的一篇文章。这篇文章所做的工作包括3部分。
1 词典自适应
假定由一个数据集聚类得到一个词典,当前有一个新的数据集。词典自适应是如何利用已有的词典,描述新的数据集。本文的词典自适应目的是根据新的数据集的SIFT特征更新已有的词典,包括两个步骤。(1)为新数据集的每张影像提取SIFT特征,将各个SIFT特征映射到单词上;(2)经过上步,每个单词都可能会被赋予一定数量的SIFT的特征,利用各个单词所拥有的SIFT特征求均值,得到更新后的单词。
2 归一化(Intra-normalization)
包括两步归一化。(1)首先为每个单词的残差做归一化;(2)将第一步得到的归一化向量串在一起再用得到新的归一化向量。
3 Multi-VLAD
将同一张图像用多个VLAD表示。
总结:
文章的Intra-normalization应当会带来一定引用。