后缀数组模板

先放上模板代码,等理解了再详细写吧。

模板代码:

#include<cstdio>
#include<iostream>
#include<algorithm>
#include<cstring>
using namespace std;
const int MAX=100000+10;
int rk[MAX],sa[MAX],height[MAX];
//rk-名次数组,sa后缀数组,height-LCP相邻后缀的最长公共前缀长度
int s[MAX],buc[MAX],x[MAX],y[MAX]
//s-原数组,buc-计数排序数组,x,y-两个关键字数组

void getsa(int n,int m)
{
    int i,k,p;
    for(i=0; i<m; i++) buc[i]=0;
    for(i=0; i<n; i++) buc[x[i]=s[i]]++;
    for(i=1; i<m; i++) buc[i]+=buc[i-1];
    for(i=n-1; i>=0; i--) sa[--buc[s[i]]]=i
    for(k=1; k<=n; k<<=1)
    {
        p=0;
        for(i=n-1; i>=n-k; i--) y[p++]=i;
        for(i=0; i<n; i++) if(sa[i]>=k) y[p++]=sa[i]-k;
        for(i=0; i<m; i++) buc[i]=0;
        for(i=0; i<n; i++) buc[x[y[i]]]++;
        for(i=1; i<m; i++) buc[i]+=buc[i-1];
        for(i=n-1; i>=0; i--) sa[--buc[x[y[i]]]]=y[i];
        swap(x,y);p=1;x[sa[0]]=0;
        for(i=1; i<n; i++)
        {
            if(y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k]) x[sa[i]]=p-1;
            else x[sa[i]]=p++;
        }
        if(p>=n) break;
        m=p;
    }
    return ;
}

void getlcp(int n)
{
    int i,j,k=0;
    for(i=1; i<=n; i++) rk[sa[i]]=i;
    for(i=0; i<n; height[rk[i++]]=k)
        for(k?k--:0,j=sa[rk[i]-1]; s[i+k]==s[j+k]; k++);
    return ;
}


引用一份大牛对代码的详细解释:

int wa[maxn],wb[maxn],wv[maxn],ws[maxn];
int cmp(int *r,int a,int b,int l)
{
      return r[a]==r[b]&&r[a+l]==r[b+l];
}
void da(int *r,int *sa,int n,int m)
{
     int i,j,p,*x=wa,*y=wb,*t;
     for(i=0;i<m;i++) ws[i]=0;
     for(i=0;i<n;i++) ws[x[i]=r[i]]++;
     for(i=1;i<m;i++) ws[i]+=ws[i-1];
     for(i=n-1;i>=0;i--) sa[--ws[x[i]]]=i;
     for(j=1,p=1;p<n;j*=2,m=p)
     {
          for(p=0,i=n-j;i<n;i++) y[p++]=i;
          for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;
          for(i=0;i<n;i++) wv[i]=x[y[i]];
          for(i=0;i<m;i++) ws[i]=0;
          for(i=0;i<n;i++) ws[wv[i]]++;
          for(i=1;i<m;i++) ws[i]+=ws[i-1];
          for(i=n-1;i>=0;i--) sa[--ws[wv[i]]]=y[i];
          for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)
              x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
      }
      return;
}
看似简单,但对我这样的初学者来说还是有一定的难度,不好读识清楚。

 

int wa[maxn],wb[maxn],wv[maxn],ws[maxn];
//
int cmp(int *r,int a,int b,int l)
{
 return r[a]==r[b]&&r[a+l]==r[b+l];
}

//求后缀数组
void da(int *r,int *sa,int n,int m)
{
 int i,j,p,*x=wa,*y=wb,*t;//
 for(i=0;i<m;i++) ws[i]=0;//将基数排序的桶清0
 for(i=0;i<n;i++) ws[x[i]=r[i]]++;//x[i]=r[i],x[]存放1h的相对排名;ws[]存放每个桶中元素的个数;具体的每个ws[]存放并列排名的1hsa[]
 for(i=1;i<m;i++) ws[i]+=ws[i-1];//ws[]存放每个桶的累加排名
 for(i=n-1;i>=0;i--) sa[--ws[x[i]]]=i;//计算出每个元素的排名,相同桶中元素越靠后排名越大,保证1h排名从0-n-1,取逆建立后缀数组
 for(j=1,p=1;p<n;j*=2,m=p)
 {
  //以下两行代码实现了对第二关键字的排序
  for(p=0,i=n-j;i<n;i++) y[p++]=i;//后缀在原字符串中的起始位置在第n-j至n的元素的第二关键字都为0,因此如果按第二关键字排序,必然这些元素都是排在前面的。
  for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;//if(sa[i]>=j),则说明该长度为j的片段可以与前面某个长度为j的片段合并
  for(i=0;i<n;i++) wv[i]=x[y[i]];//
  for(i=0;i<m;i++) ws[i]=0;//以下四三行代码与上面功能一样
  for(i=0;i<n;i++) ws[wv[i]]++;
  for(i=1;i<m;i++) ws[i]+=ws[i-1];
  for(i=n-1;i>=0;i--) sa[--ws[wv[i]]]=y[i];//计算出每个元素的排名,相同桶中元素越靠后排名越大,保证1h排名从0-n-1,取逆建立后缀数组
  for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)//这里就是用x[]存储计算出的各字符串rank的值了,记得我们前面说过,计算sa[]值的时候如果字符串相同是默认前面的更小的,但这里计算rank的时候必须将相同的字符串看作有相同的rank,要不然p==n之后就不会再循环啦
   x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
 }
 return;
}



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值