图像检索:EMD距离(Earth Mover's Distance)及纠错

转载请注明:http://blog.csdn.net/zhangping1987/article/details/25368183

在理解EMD距离模型时,需要先对《运筹学》中运输问题,做一下了解。下面给出几个运输问题的小例子,作为补充知识:

那么,对于上述问题我们发现是一个 产量=销量=500 ,即产销平衡的问题,可以提出这样的数学模型:

假设运到物品的个数为,用代表运到单个物品的运费(在上述表格中都有),用表示产地的产量,表示销地的销量,则总运费为,使总运费最小的数学模型为:


还有令两种可能就是 产量>销量 或者 产量<销量,这里不做模型的讨论,上面三种运输问题都可以用单纯形法进行求解。因为只有当“产量=销量”即:时,EMD是作为距离的。

以下给出EMD距离的具体定义和相关证明

————————————————————————————————————————————————————————————————————————————

EMD是由 2000年YOSSI RUBNER在《The Earth Mover's Distance as a Metric for Image Retrival》论文中提出的。 




其中

代表一张图片的特征,代表另一张图片的特征,代表特征的权重,代表特征的权重,代表之间的距离(L1,L2,等距离),

通过以下最优化问题:




解出,EMD的定义为:

                                                                                                        

我们知道距离定义必须满足三点:正定性,齐次性,三角不等式,正定性和齐次性很容易证明。下面主要证明三角不等式。作者YOSSI RUBNER证明了,当


时,EMD是满足三角不等式的,即EMD是距离。

所以注意:在使用EMD距离时,要让权重的和是相等的。

三角不等式:

的最优化解,的最优化解,其中

需要证明三角不等式:

证明:我们首先找到从的最优化问题的可行解为

我们设代表从第个“产地”()中转到第个中转地(),再运到第个销地()的“物品”的数量,则我们可得到:

令:

下面证明的最优化问题的可行解,满足四个约束条件即可:

第四个约束条件:                                                 

均满足四个条件,所以,的最优化问题的可行解,则:



所以,EMD就是在“产销平衡”时是实实在在的距离。

————————————————————————————————————————————————————————————————————————————

在作者的个人主页给出了C代码。

OPencv也已经实现了EMD,我们用EMD距离比较两个直方图,下面说一下,用OPencv中的EMD函数注意事项:



注意:红色一列是每一行特征的权重,权重后边是坐标,我们看到的红色这一列和等于1,即在使用时,这一列一定要相等,即产销平衡。

代码我不写了,就把上面这个矩阵放入Mat,然后带入EMD这个函数即可。

在原论文中只证明了总权重相等时,EMD才是距离,但是在Opencv的手册,介绍EMD说,总权重可以不相等,这一点比较困惑!

2014年8月5日,我在做基于颜色的图像检索时,发现EMD距离,也可以做三维直方图



————————————————————————————————————————————————————————————————————————————

第一次,写关于计算机视觉的文章,请大家批评指正!!欢迎回帖!

  • 23
    点赞
  • 66
    收藏
    觉得还不错? 一键收藏
  • 15
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 15
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值