后缀数组及lcp学习笔记

本文详细介绍了后缀数组的构建方法,包括倍增法和基数排序,并讲解了LCP(最长公共前缀)的概念及其应用,如计算本质不同的子串个数和求至少出现k次的子串最大长度等。
摘要由CSDN通过智能技术生成

模板题

给出一个字符串,输出排名为 i i i 的后缀的编号, i = 1 , 2 , 3 , . . . n i=1,2,3,...n i=1,2,3,...n

一种求法

想当年我字符串题用哈希水遍天下=.=
可以二分 l c p lcp lcp,然后用哈希判断相不相等,套个 s o r t sort sort,就能快速对后缀排序。
复杂度是 O ( n l o g 2 n ) O(nlog^2n) O(nlog2n)

后缀数组

后缀数组指的是两个数组 s a i sa_i sai r k i rk_i rki
r k i rk_i rki 指的是后缀 [ i , n ] [i,n] [i,n] 的排名, s a i sa_i sai 指的是排名为 i i i 的后缀 [ s a i , n ] [sa_i,n] [sai,n]
在这里插入图片描述

性质满足 s a [ r k [ i ] ] = r k [ s a [ i ] ] = i sa[rk[i]]=rk[sa[i]]=i sa[rk[i]]=rk[sa[i]]=i
我们最终要求的就是 s a i sa_i sai 这个序列。

倍增求 s a sa sa

我们求后缀的排名,可以先比较前 1 1 1 位,再比较前 2 2 2 位,再比较前 4 4 4 位,再比较前 8 8 8 位…
也就是每次求出 [ i , i + 2 ∗ w − 1 ] [i,i+2*w-1] [i,i+2w1] 的排名, w = 1 , 2 , 4 , 8... w=1,2,4,8... w=1,2,4,8...
[ i , i + 2 ∗ w − 1 ] [i,i+2*w-1] [i,i+2w1] 的排名,我们可以将它分为 [ i , i + w − 1 ] [i,i+w-1] [i,i+w1] [ i + w , i + 2 ∗ w − 1 ] [i+w,i+2*w-1] [i+w,i+2w1] 两部分。这两部分的排名都已经在上一次循环中求出来了,我们要得到新的排名,其实是让这两部分作为双关键字进行排序。 [ i , i + w − 1 ] [i,i+w-1] [i,i+w1] 的排名为第一关键字, [ i + w , i + 2 ∗ w − 1 ] [i+w,i+2*w-1] [i+w,i+2w1] 的排名为第二关键字(如果没有第二关键字认为第二关键字为无穷小或 0

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值