后缀数组模版

参考论文

int wa[MAXN],wb[MAXN],wv[MAXN],ws[MAXN];
inline bool cmp(int *r,int a,int b,int len){
    return r[a]==r[b]&&r[a+len]==r[b+len];
}
void SA(char *r,int *sa,int n,int m){//r为字符串数组,sa为后缀数组,n=strlen(s)+1,m为max(r[i])+1。
    int i,j,p,*x=wa,*y=wb,*t;
    //对长度为1的字符串基数排序。
    for(i=0;i<m;i++)
        ws[i]=0;//清零。
    for(i=0;i<n;i++)
        ws[x[i]=r[i]]++;//统计各相同字符的个数。
    for(i=1;i<m;i++)
        ws[i]+=ws[i-1];//统计小于等于i的字符共有多少个。
    for(i=n-1;i>=0;i--)
        sa[--ws[x[i]]]=i;//小于等于r[i]共有ws[x[i]]个,因此r[i]排在第ws[x[i]]个。

    for(j=p=1;p<n;j<<=1,m=p){//p是第二关键字为0的个数,j是当前比较的字符串长度.
        //对第二关键字基数排序。
        //y[s]=t表示排在第s个的起点在t,即y[s]对第二关键字排序,但y[s]的值指向第一关键字的位置。
        for(p=0,i=n-j;i<n;i++)
            y[p++]=i;//在n-j之后的第二关键字都为0,排在前面,即第p个。
        for(i=0;i<n;i++){
            if(sa[i]>=j)//如果排在第i个的字符串起点在sa[i],满足sa[i]>=当前字符串长度j。
                y[p++]=sa[i]-j;//对于sa[i]-j为起点的第二关键字排在前面。
        }
        //对第一关键字基数排序。
        for(i=0;i<m;i++)
            ws[i]=0;//清零。
        for(i=0;i<n;i++)
            ws[wv[i]=x[y[i]]]++;//第二关键字排在第i个的起点在y[i],x[y[i]]就是y[i]指向的字符,ws进行个数统计。
        for(i=1;i<m;i++)
            ws[i]+=ws[i-1];//统计字符小于等于i的个数。
        for(i=n-1;i>=0;i--)//wv[i]是排在第i个第二关键字对应的第一关键字。
            sa[--ws[wv[i]]]=y[i];//y[i]就是第一关键字的位置。
        for(t=x,x=y,y=t,x[sa[0]]=0,p=i=1;i<n;i++)//交换x,y的地址,x保存当前rank值,y为前一次rank值。
            x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
        //若rank[sa[i-1]]=rank[sa[i]],则必然sa[i-1]+j没有越界,因为不可能有相等的后缀。
    }
}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值