专题:后缀数组——维护后缀排名的强大工具

什么是后缀数组

  • 我们有时会需要判断多个字符串后缀的的字典序大小,此时我们可以用后缀数组维护。

原理

  • 我们利用倍增的思想,先比较长度为 len 的字符串的字典序排名,之后在把他们合并起来。
  • 具体的合并操作和基数排序是类似的,由于基数排序的稳定性,我们先以第一关键字排序再以第二关键字排序会得到一个”稳定”的序列。所以我们可以把 [l,len+l] 的字典序排名为第一关键字把 [len+l+1r] 的字典序排名为第二关键字来排序,由于第一关键字就是上一层的把第二关键字,于是我们每次都排一下第二关键字即可。
void init_Sa(int n,int m){
    /*sa[i]表示Rank为i的串的左端点即rank[sa[i]]=i */ 
    /*我们先用基数排序排一遍得到长度为1的串的sa[i]*/
    for(int i=1;i<=m;i++)cnt[i]=0;
    for(int i=1;i<=n;i++)++cnt[x[i]=S[i]];
    for(int i=1;i<=m;i++)cnt[i]+=cnt[i-1];
    /*基数排序:cnt[i]小于等于i的数有几个,是我们就得到了x[i]排名为cnt[x[i]]*/  
    for(int i=1;i<=n;i++)sa[cnt[x[i]]--]=i;
    /*
        我们就开始把长度为len的串合并成长度为len*2的
        此时长度为len的已经被排序了
        我们就把[l,l+len]为第一关键字[l+len+1,r]为第二关键字
        并且此时第二关键字已经处理出来了
    */
    for(int len=1;len<=n;len<<=1){
        int p=0;
        /*在末尾的后缀如果不足len了它的第一关键字是空的,故它的字典序为0*/
        for(int i=n-len+1;i<=n;i++)y[++p]=i;
        /*如果它的左端点比len大则有第一关键字就按顺序加入,由于长度增加了len所以左端点减去len*/
        for(int i=1;i<=n;i++)if(len<=sa[i])y[++p]=sa[i]-len;
        /*基数排序搞一下*/
        for(int i=1;i<=m;i++)cnt[i]=0; 
        for(int i=1;i<=n;i++)cnt[x[i]]++;
        for(int i=1;i<=m;i++)cnt[i]+=cnt[i-1];
        for(int i=n;i>=1;i--)sa[cnt[x[y[i]]]--]=y[i];
        int R=1;swap(x,y);x[sa[1]]=1;
        /*得到排名*/
        for(int i=2;i<=n;i++)
            x[sa[i]]=(y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+len]==y[sa[i]+len])?R:++R;
        /*大于总元素个数后结束*/ 
        if((m=R)>=num)break;
    }for(int i=1;i<=n;i++)rk[sa[i]]=i;
}
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值