Earth Mover's Distance 原理解析
Earth Mover's Distance距离即EMD,是由2000年IJCV期刊文章《The Earth Mover's Distance as a Metric for Image Retrieval》
提出的一种图像相似度度量方法,从文章标题也可以得知,最初EMD的概念是用于图像检索的。后来因为其各种优点,逐渐用到其他方面的相似度度量。该部分主要理解EMD的概念与原理。
几个主要的概念
-
signature 定义为一系列的重要特征,可以写作,是某个特征,是该特征的权重。
,
-
EMD本身是一个线性规划问题。假设是一张图像的某个特征,是特征的权重,而是另一张图像的某特征,是特征的权重。
-
一个特征集合和特征集合之间的距离矩阵 ,每一项代表和的距离(比如L1、L2距离等),可知 是个矩阵。
目标
希望找到一个flow
,它也是一个矩阵 ,每一项代表从到的流动数量,是位置到位置的代价(距离),从而最小化全局的代价函数:
这个流动量就是线性规划的解
- 线性规划表达式:
- 线性规划示意图
- 对于这篇论文来说,子图之间的相似度,线性规划表达式:
Pyramid Match Graph Kernel (Histogram intersection 直方图交叉核)原理解析
方法最初来自《The Pyramid Match Kernel:Discriminative Classification with Sets of Image Features》
这篇论文,用来对特征构成的直方图进行相似度匹配.
基本原理
-
PM
的工作原理是将特征空间划分为越来越大的区域,并对每个级别的匹配进行加权求和。 -
如果他们属于同一地区,则说两点相符。较大区域内的匹配加权低于较小区域的匹配。
-
一维示意图