文章简介
- 文章标题:
Exact Computation of Graph Edit Distance for Uniform and Non-uniform Metric Edit Costs
其他标题:On the exact computation of the graph edit distance - 论文链接:
2.1论文初稿1
2.2论文网站版本 - 文章来源:期刊 Pattern Recognition Letters 2018
- 作者单位:
单位:
博赞博尔扎诺自由大学(Free University of Bozen-Bolzano),计算机科学学院,意大利
姓名:
戴维·B·布卢门撒尔 (David B. Blumenthal)
约翰·甘珀(Johann Gamper)
邮箱:
david.blumenthal@inf.unibz.it
gamper@inf.unibz.it
文章思路总结
重要术语解释
1. uniform cost:
If the cost of each edit operation equals 1, we say that the edit costs are uniform.
编辑操作分为顶点的增加、删除、标签修改,边的增加、删除、标签修改这六种操作。如果每一步的操作成本都是1,则代价是uniform。
例如,如果图形建模的是空间对象,并且节点标签是欧几里得坐标,则将节点的标签从α更改为β所必须付出的成本
c
V
(
α
,
β
)
c_V(α,β)
cV(α,β)可能应定义为α与β之间的欧几里得距离。(即不是代价为一的编辑距离)
2.DF_GED
DF_GED也是A* 算法的一种优化,但是基本思想仍然是通过节点映射的方法,找出成本最小的映射编辑路径。
下面的没看懂
lower bound 是什么意思?
作者的优化思路是:原来的DF_GED的算法在计算编辑距离的时候是non-uniform的,怎样把这个算法推广到uniform的情况。并且在计算部分映射
h
(
π
)
h(\pi)
h(π)使用线性时间。
注意,
g
(
π
)
g(\pi)
g(π)和
h
(
π
)
h(\pi)
h(π)和表示相应的不完整的导出编辑路径和从映射
π
\pi
π到叶子节点的下界(完整的映射)。
以上计算下界的过程,如果使用匈牙利算法,时间复杂度是三次方。复杂度的底数是俩个图节点个数和,指数是俩个图边数较大的一个。这种复杂度计算量很高,作者通过一个引理,可以在线性时间内计算出来下界
h
(
π
)
h(\pi)
h(π):
头脑里面好像有浆糊
3.CSI_GED
CES_GED也是通过A* 算法,搜索最佳的映射路径。但是不同其他的顶点映射,算法使用了边映射的方法。本文针对CSI_GED只针对uniform cost的情况,将其归纳到non-uniform的情况。
original CSI_GED:
改进的GSI_GED:
引理2中使用
Γ
n
u
(
)
\Gamma^{nu}()
Γnu()替换了原来的值,这是主要的变化。
遗留的问题
- 什么是上界?在A* 算法中,经常提到上界和下界,它和启发式算法有什么联系?
- A* 算法的思路到底是什么?
文章总结:
1.解决问题
文章整理了前人研究的几种基于A* 搜索计算编辑距离的三种算法DF_GED、DF、CSI_GED。这三种算法虽然比A* 算法在性能上要优越,但是却不能拓展到uniform或者non-uniform的情况。作者为了解决这个问题,将DF_GED和CSI_GED的算法进行了细致的研究。
2.使用方法
基于A* 搜索的方法,重点研究了上界和下界的计算。
3.文章不足
虽然作者将uniform和non-uniform的情况都考虑在了基于A* 算法中,但是对于不同的数据集来讲,未能考虑到数据集的属性,不能确定是否使用基于节点映射的A* 算法好,还是基于边映射的A* 算法好。因此需要对于图数据集进行个性化把这个选择确定下来。