后缀数组是处理字符串问题常用的工具之一,只不过我当时学的时候不求甚解,所以对于其中实现的计数排序,不是特别的懂,只会逃一个模板,把后缀数组sa求出来。
int s[maxn]; //待构造字符串
int sa[maxn]; //后缀数组
int t[maxn],t2[maxn],c[maxn]; //辅助数组
//每个字符值必须为0-m-1,n一般为串长+1
void build_sa(int m,int n) //构造后缀数组
{
int i,*x=t,*y=t2;
for(i=0;i<m;i++) c[i]=0;
for(i=0;i<n;i++) c[x[i]=s[i]]++;
for(i=1;i<m;i++) c[i]+=c[i-1];
for(i=n-1;i>=0;i--) sa[--c[x[i]]]=i;
for(int k=1;k<=n;k<<=1)
{
int p=0;
for(i=n-k;i<n;i++) y[p++]=i;
for(i=0;i<n;i++) if(sa[i]>=k) y[p++]=sa[i]-k;
for(i=0;i<m;i++) c[i]=0;
for(i=0;i<n;i++) c[x[y[i]]]++;
for(i=0;i<m;i++) c[i]+=c[i-1];
for(i=n-1;i>=0;i--) sa[--c[x[y[i]]]]=y[i];
swap(x,y);
p=1;x[sa[0]]=0;
for(i=1;i<n;i++)
x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+k]==y[sa[i]+k]?p-1:p++;
if(p>=n) break;
m=p;
}
}
求出后缀数组后,还有2个很重要的数组rank和height要求出来
int rank[maxn]; //后缀i在sa数组中的下标
int height[maxn]; //sa[i-1]和sa[i]的LCP
void getheight(int n) //n为串长
{
int i,j,k=0;
for(i=0;i<=n;i++) rank[sa[i]]=i;
for(i=0;i<n;i++)
{
if(k) k--;
int j=sa[rank[i]-1];
while(s[i+k]==s[j+k]) k++;
height[rank[i]]=k;
}
}
后缀数组往往会配和二分或者RMQ来解决问题
这里顺便记录一下配合后缀数组的RMQ
int d[maxn][50];
void RMQ_init(int n)
{
for(int i=0;i<n;i++) d[i][0]=height[i];
for(int j=1;(1<<j)<=n;j++)
for(int i=0;i+(1<<j)-1<n;i++)
d[i][j]=min(d[i][j-1],d[i+(1<<(j-1))][j-1]);
}
int RMQ(int L,int R)
{
if(L>R) swap(L,R);
if(L==R) return L-sa[L];
L++;
int k=0;
while((1<<(k+1))<=R-L+1) k++;
return min(d[L][k],d[R-(1<<k)+1][k]);
}
调用的时候如下
build_sa(m,n+1);
getheight(n);
RMQ_init(n+1);