SA倍增算法
学习资料论文
后 缀 数 组
—-处理字符串的有力工具 处理字符串的有力工
#include<iostream>
#include<cstring>
#include<cstdlib>
#include<algorithm>
#include<cctype>
#include<cmath>
#include<ctime>
#include<string>
#include<stack>
#include<deque>
#include<queue>
#include<list>
#include<set>
#include<map>
#include<cstdio>
#include<limits.h>
#define MOD 1000000007
#define fir first
#define sec second
#define fin freopen("/home/ostreambaba/文档/input.txt", "r", stdin)
#define fout freopen("/home/ostreambaba/文档/output.txt", "w", stdout)
#define mes(x, m) memset(x, m, sizeof(x))
#define Pii pair<int, int>
#define Pll pair<ll, ll>
#define INF 1e9+7
#define inf 0x3f3f3f3f
#define Pi 4.0*atan(1.0)
#define lowbit(x) (x&(-x))
#define lson l,m,rt<<1
#define rson m+1,r,rt<<1|1
#define max(a,b) a>b?a:b
typedef long long ll;
typedef unsigned long long ull;
const double eps = 1e-9;
const int maxn = 1e6;
const int maxm = 1e6+10;
using namespace std;
inline int read(){
int x(0),f(1);
char ch=getchar();
while (ch<'0'||ch>'9') {if (ch=='-') f=-1;ch=getchar();}
while (ch>='0'&&ch<='9') x=x*10+ch-'0',ch=getchar();
return x*f;
}
int wa[maxn];
int wb[maxn];
int wn[maxn];
int wm[maxn];
int rk[maxn];
int height[maxn];
int cmp(int *r,int a,int b,int l){
return r[a]==r[b]&&r[a+l]==r[b+l];
}
void da(int *r,int *sa,int n,int m){
int i,j,*x=wa,*y=wb,*t,p;
for(i=0;i<m;++i) wn[i]=0;
for(i=0;i<n;++i) wn[x[i]=r[i]]++;
for(i=1;i<m;++i) wn[i]+=wn[i-1];
for(i=n-1;i>=0;--i) sa[--wn[x[i]]]=i;
for(j=1,p=1;p<n;j<<=1,m=p){
for(p=0,i=n-j;i<n;++i) y[p++]=i;
for(i=0;i<n;++i){
if(sa[i]>=j){
y[p++]=sa[i]-j;
}
}
计数排序O(n),m过大可用快排
for(i=0;i<n;i++) wm[i]=x[y[i]];
for(i=0;i<m;i++) wn[i]=0;
for(i=0;i<n;i++) wn[wm[i]]++;
for(i=1;i<m;i++) wn[i]+=wn[i-1];
for(i=n-1;i>=0;i--) sa[--wn[wm[i]]]=y[i];
for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)
x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
}
}
void getHeight(int *r,int *sa,int n){
int i,j,k=0;
for(i=1;i<=n;++i){
rk[sa[i]]=i;
}
for(i=0;i<n;height[rk[i++]]=k){
for(k?k--:0,j=sa[rk[i]-1];r[i+k]==r[j+k];k++);
}
}
//主要为了方便后面求height[]的操作。避免这句中rank[i]-1出现为负数的情况
int main()
{
fin;
string str;
cin>>str;
int r[maxn];
int n=str.size();
int m=30;
for(int i=0;i<str.size();++i){
r[i]=str[i]-'a'+1;
}
r[str.size()]=0;
int sa[maxn];
da(r,sa,n+1,m);
for(int i=0;i<n;++i){
printf("%d ",sa[i]);
}
cout<<endl;
getHeight(r,sa,n);
for(int i=0;i<n;++i){
printf("%d ",rk[i]);
}
cout<<endl;
for(int i=0;i<n;++i){
printf("%d ",height[i]);
}
cout<<endl;
return 0;
}
//height 数组:定义height[i]=suffix(SA[i-1])和suffix(SA[i])的最长公共前缀,也就是排名相邻的两个后缀的最长公共前缀的长度 。
//
/*sa[1~~n]为有效值 sa[i]=a则代表排在第i位的是第a个后缀。 a属于[0~n-1]
rank[0~n-1]是有效值 rank[i]=b则代表第i个后缀排在第b位 b属于[1~n]
height[2~n]是有效值 height[i]=c则代表排在第i位的后缀和排在第i-1的后缀的最长前缀长度是c */