内容来自
晁晓菲,杨晓龙,李书琴,唐晶磊.两棵树的公共子树查找算法综述[J].陕西理工学院学报(自然科学版),2009,25(02):33-39.
求公共子树
后缀树法-Grossi
后缀树
BANANA的后缀
- 其中叶子节点的数字代表该后缀的在原字符串中的起始坐标
基本步骤
- 将树结构转化为编码,将两个编码拼接,根据拼接编码构造后缀树
- 查找公共后缀,找到公共子树
1 构造后缀树
1.1 前序遍历树T和R等到code(T)和code(R)
编码方式:前序遍历各结点,每回溯一层添加一个标记 #
code(T)=abc#c##cca##a#cb#a###ba#b###
code(R)=bcca##a#cb#a###ba#cb#a####
1.2 拼接code(T)和code(R)得到C
C=code(T) $ code(R) $
=abc#c##cca##a#cb#a###ba#b### $ bcca##a#cb#a###ba#cb#a#### $
1.3 根据C构造后缀树S
- 根据后缀起始字符的位置将叶子结点标色
T->青绿色, R->红色
2 查找公共前缀
2.1 后续遍历S,标记红色叶子节点的父结点,如图二(c)中的结点z、v、u
2. 2 构造函数w(z),其中z为S的一个内部结点。
w(z)表示从根结点到z的路径上所有弧上标记的串联,
是所有从z向下所有叶子结点的最长公共前缀。
如图二(c)中w(z)=cb#是叶子结点2,15,38,48所对应的后缀的最长公共前缀
2.3 对青绿色叶子结点l计算deep(l)
设u为从根结点到l的具有最大深度的(在2.1中)标记的结点
若u存在,则deep(l)=|w(u)|否则deep(l)=0
如图二(d)
2.4 判断
如果S的叶子结点l对应的子树B满足len(l)<=deep(l)那么,B是T和R的公共子树
len(l)=|code(B)|
- l==15
code(B)=cb#a###
w(u)=ab#a###ba#
len(l)=6 <= deep(l)=|w(u)|=10
B是T和R的公共子树 - l==2
code(B)=cb#c###
w(z)=cb#
len(l)=6 > deep(l)=|w(z)|=3
B不是是T和R的公共子树
复杂度
时间和空间复杂度都为O(n)