——《高级数据结构》
前面介绍了几种算法构造后缀数组,虽然得到的后缀数组已经能处理一些简单的问题,但是为了让其能够具有与后缀树相媲美的字符串处理能力,需要引入辅助工具——LCP(Longest Common Prefix,最长公共前缀)。
对于字符串St1和St2,它们的最长公共前缀LCP_Str(St1,St2)定义为最大的整数len,满足St1的len次方=St2的len次方(记号意义同前文中)。当然,len不会超过两者中较短字符串的长度。对于后缀数组,我们需要知道的是任意两个后缀的最长公共前缀 。因此定义LCP_Idx(i,j)=LCP_Str(Suffix(SA(i)),Suffix(SA(j))),即排名第i的后缀和排名为j的后缀的LCP。
不难发现,LCP_Idx与操作元顺序无关,并且对于两个相同的字符串,它们的LCP即它们的长度,因此为了求解方便,我们只需要求所有i<j的LCP_Idx(i,j).
如果用朴素的方法计算LCP,那么将会非常低效。由于是针对后缀计算LCP,借鉴倍增算法的思想,在这里需要利用题目的特殊性。以下给出一种线性时间复杂度的算法。
我们首先给出需要利用到的结论,其证明将在之后给出。
(1)对于i<j,LCP_idx(i,j)=min(LCP_Idx(k-1,k)|i+1<=k<=j)
(2)对于数组height,其中height[i]=LCP_Idx(i-1,i),对于i=0的边界情况,令height[0]=0。有了height数组,对于任意两个后缀SA(i)和SA(j),根据结论(1),只需要计算min{LCP_Idx(k-1,k)|i
LCP的引入笔记
最新推荐文章于 2023-07-04 21:31:22 发布
![](https://img-home.csdnimg.cn/images/20240611030827.png)