o(︶︿︶)o 唉,也是为了应付知识储备太少,万一遇到了类似的题不知道用啥算法就蛋疼了,所以来恶补一下这些东西。
囤一发模板,详细讲解请见2009罗橞骞的论文《后缀数组--处理字符串的有力工具》,基本网上所有的讲解都是来自这篇文章,代码也是这篇论文上的,就不说啥了。
#include<bits/stdc++.h>
using namespace std;
#define MAXN 100010
char s[MAXN];
int A[MAXN];
//为了方便基数排序,我们把s中的字符转换成数字.s和A的下标使用统一0-n-1
int sa[MAXN],rank[MAXN];//最后结果的rank和sa
int Count[MAXN];//基数排序计数器
int l[MAXN],r[MAXN],tmp[MAXN];//基数排序共有两个关键字,r为第二关键字基数排序结果,l值即临时rank值.
int n,maxn;//计数上界
bool comp(int *A,int a,int b,int len)//字符串比较
{
return A[a]==A[b]&&A[a+len]==A[b+len];
}
int main()
{
/*省略读入等奇怪的过程*/
int i,j,k,*x=l,*y=r;//后面会整体交换l,r为了方便使用指针
for (i=0;i<maxn;i++) Count[i]=0;
for (i=0;i<n;i++) Count[x[i]=A[i]]++;//第一次基数排序
for (i=1;i<maxn;i++) Count[i]+=Count[i-1];
for (i=n-1;i>=0;i--) sa[--Count[x[i]]]=i;//初始的sa
for (k=1,i=1;i<n;k<<=1,maxn=i)
{
for (i=0,j=n-i;j<n;j++) y[i++]=i;//第二次基数排序
for (j=0;j<n;j++) if (sa[j]>=k) y[i++]=sa[j]-k;
for (j=0;j<n;j++) tmp[j]=x[y[j]];
for (j=0;j<maxn;j++) Count[j]=0;
for (j=0;j<n;j++) Count[tmp[j]]++;
for (j=1;j<maxn;j++) Count[j]+=Count[j-1];
for (j=n-1;j>=0;j--) sa[--Count[tmp[j]]]=y[j];//更新sa
for (swap(x,y),i=1,x[sa[0]]=0,j=1;j<n;j++) x[sa[j]]=comp(y,sa[j-1],sa[j],k)?i-1:i++;//更新rank
//在更新过程中可能有两字符串rank值相同,此时比较两字符串是否完全相同来区分rank值
//由于y数组在被用来更新sa后已经无用(下一次会重新求),节省空间使用y保存rank
}
}
o(︶︿︶)o 唉,也是为了应付知识储备太少,万一遇到了类似的题不知道用啥算法就蛋疼了,所以来恶补一下这些东西。