后缀数组学习小结

学习主要是参考 罗穗骞 的《后缀数组——处理字符串的有力工具》论文
然后自己结合其他书上的后缀数组的实现的方法,选择了一个比较简单的实现版本。
我的SA模板

*
我的后缀数组和论文的后缀数组
计算出来的lcp高度数组有一个下标的偏移
我的高度数组是lcp数组,也就是[0,n)是有效值
论文的后缀数组在计算sa数组的时候是在字符串的末尾加上一个0
我的这个模板不用这样操作(因为在计算的时候特判了)
*/
int n,k;
int rank[maxn],tmp[maxn],sa[maxn],lcp[maxn];
char s[maxn];
int cmp(int i,int j){
    if(rank[i]!=rank[j])return rank[i]<rank[j];
    int ri=i+k<=n?rank[i+k]:-1;
    int rj=j+k<=n?rank[j+k]:-1;
    return ri<rj;
}
void getSa(){
    n=strlen(s);
    for(int i=0;i<=n;i++){
        sa[i]=i;
        rank[i]=i<n?s[i]:-1;
    }
    for(k=1;k<=n;k<<=1){
        sort(sa,sa+n+1,cmp);
        tmp[sa[0]]=0;
        for(int i=1;i<=n;i++){
            tmp[sa[i]]=tmp[sa[i-1]]+cmp(sa[i-1],sa[i]);
        }
        for(int i=0;i<=n;i++)rank[i]=tmp[i];
    }
}
void getLcp(){
   // n=strlen(s);
    for(int i=0;i<=n;i++)rank[sa[i]]=i;
    int h=0;
    lcp[0]=0;
    for(int i=0;i<n;i++){
        int j=sa[rank[i]-1];
        if(h>0)h--;
        while(i+h<n&&j+h<n&&s[i+h]==s[j+h])h++;
        lcp[rank[i]-1]=h;
    }
}

后缀数组应用:
1,字符串的匹配,利用二分进行后缀的匹配 ,时间O(TlogS)
2,找回文串(也可用简单的manacher)
3,可以重叠的最长重复子串,按照lcp分组,二分答案
4,无重叠的最长重复子串,做法基本如上
5,不同的子串的个数
6,可重叠的出现k次的最长重复子串

多个字符串一般是用不同的分隔符,把他们连接起来
然后求后缀数组,与高度数组,在按照高度数组分组等
详细解法,看论文。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值