EMD距离即Earth Mover's Distance,是由2000年IJCV期刊文章《The Earth Mover's Distance as a Metric for Image Retrieval》提出的一种图像相似度度量方法,从文章标题也可以得知,最初EMD的概念是用于图像检索的。后来因为其各种优点,逐渐用到其他方面的相似度度量。这篇文章主要理解EMD的概念。
signature
论文定义,“We introduce a distance between two signatures that we call the Earth Mover's Distance(EMD)”,那么这里的signature是什么呢?
1.图像的直方图就是把全部像素值量化为一系列bin,统计每个bin的像素个数;bin值可以看作特征,bin高度可以看作该特征的重要程度。
2.而 signature 定义为一系列的重要特征,可以写作 s = (m, w),m是某个特征,w是该特征的权重。文中说“A signature is a set of the main clusters or modes of a distribution”,作者认为,传统的完整直方图一般会聚集在某些bin上,这样过于浪费空间,用 signature 可以较稀疏的表达直方图内容。
事实上,虽然原文