题解:后缀数组板子
之前学后缀数组只是学了个大概,而且写的是二维的。现在从头理一遍,改成了算法导论上的写法。。
#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
#define N 100003
using namespace std;
int rank[N],sa[N],xx[N],yy[N],*x,*y,height[N],b[N],a[N],p,len;
char s[N];
int cmp(int i,int j,int l)
{
return y[i]==y[j]&&(i+l>=len?-1:y[i+l])==(j+l>=len?-1:y[j+l]);
}
void get_SA()
{
x=xx; y=yy; int m=26;
for (int i=0;i<len;i++) ++b[x[i]=a[i]];
for (int i=1;i<=m;i++) b[i]+=b[i-1];
for (int i=len-1;i>=0;i--) sa[--b[x[i]]]=i;
for (int k=1;k<=len;k<<=1) {//进行基数排序,基数排序需要进行两次排序,第一次是以第二关键字排序,第二次是以第一关键字排序,我们在进行排序的时候对于每个位置来说第一关键
//就是当前位置为起点长度2^(k-1)的串的排名,第二关键字就是x+2^(k-1)位置开始长度为2^(k-1)的串的排名。
p=-1;
for (int i=len-k;i<len;i++) y[++p]=i;//这些位置不存在第二关键字,所以第二关键字是0,排在最前面
for (int i=0;i<len;i++)
if (sa[i]>=k) y[++p]=sa[i]-k; //由上一次的sa直接计算出第二关键字,i是从小到大有序的,那么sa[i]的排名会是sa[i]-k的第二关键字,那么这样得到的就是第二关键字的位置排名。
for (int i=0;i<=m;i++) b[i]=0;
for (int i=0;i<len;i++) ++b[x[y[i]]];
for (int i=1;i<=m;i++) b[i]+=b[i-1];
for (int i=len-1;i>=0;i--) sa[--b[x[y[i]]]]=y[i];//对于第一关键字进行排序
swap(x,y); p=1; x[sa[0]]=0;
for (int i=1;i<len;i++)
x[sa[i]]=cmp(sa[i-1],sa[i],k)?p-1:p++;//计算rank值,注意存在排名相同的串。x中存的就是每个位置的rank
if (p>=len) break;
m=p;
}
p=0;
for (int i=0;i<len;i++) rank[sa[i]]=i;
for (int i=0;i<len;i++) {//height中存储的是排名相邻两个后缀的最长公共前缀。
if (rank[i]==0) continue;
int j=sa[rank[i]-1];
while (i+p<len&&j+p<len&&s[i+p]==s[j+p]) p++;
height[rank[i]]=p;
p=max(0,p-1);
}
}
int main()
{
freopen("a.in","r",stdin);
scanf("%s",s);
len=strlen(s);
for (int i=0;i<len;i++) a[i]=s[i]-'a'+1;
get_SA();
for (int i=0;i<len;i++) printf("%d ",sa[i]+1); printf("\n");
for (int i=1;i<len;i++) printf("%d ",height[i]); printf("\n");
}