参考文献 Hamming Embedding and Weak Geometric Consistency for Large Scale Image Search
在SIFT结合BOF模型中,如果聚类时聚类中心数量选择过大或过小,都会造成一定的问题。
如图所示,红色的方框表示一个特征,红色的叉表示该特征的各种噪音版本,本质上应该是一类特征。如果K选择过大(左图),则会对特征分得过细,导致这些噪音特征分到不同的聚类中心中;如果k选择过小(右图),则降低了BOF的描述能力,使得很多本来不是同一类的特征也被分到了一个聚类空间中。那么有没有一种方法既不让噪音版本分到不同的聚类中心去,又保证了BOF的描述能力不下降呢?
在K-MEANS时我们选择较小的k,形成比较粗糙的字典,在匹配时对每个聚类中心里的点再继续细分,具体的,给每个点赋予一个新的64维特征向量,该向量的每一个维度取值只能是0或1的binary,然后计算两两特征之间的汉明距离,如果汉明距离小于一个阈值则认为这两个向量属于同一类。汉明距离的计算公式如下: