《Iterative Quantization: A Procrustean Approach to Learning Binary Codes》这篇文章发表在2011年的CVPR会议上,由Yunchao Gong作为第一作者所著。本文是对上述文章部分段落的翻译和解析,希望读者能对这篇文章有大致的理解。
这篇文章立足的问题是如何学习一种similarity-preserving的二进制编码,similarity-preserving的意思是相似性保存,能保存相似性。这种二进制编码在大规模图片集合中的快速检索,比如使用哈希表是很有作用的。所谓能保留相似性的意思,就是本来相似的图片,它们编码出来的二进制也是相似的。本来不相似的图片,它们编码出来的二进制也是不相似的。
Yunchao Gong用一种交替最小化法,来找到一种最优的方式来旋转“零中心的”数据,使得量化误差最小。“零中心”为zero-centered,意思是,假设有n个d维数据,第i个数据为Xi,sum(Xi)为d维零向量。将数据零中心化的方法是,所有原始数据点减轻数据均值。量化误差,是在将数据点映射到一个零中心的二进制超立方体后产生的误差。注意该二进制超立方体的每一维端点值是-1和1,而并不是0和1。这个方法叫ITQ(Iterative Quantization method,迭代量化法)与多类别的谱聚类和正交的Procrustes问题有联系,能用在PCA或者CCA(canonical correlation analysis)上面。
很多二进