#include<iostream>
#include<cstring>
using namespace std;
const int MAXN=1010;
struct SuffixArray{
int wa[MAXN]; //用来进行基数排序或临时变量
int wb[MAXN]; //用来进行基数排序或临时变量
int wv[MAXN]; //用来进行基数排序或临时变量
int ws[MAXN]; //用来进行基数排序或临时变量
int sa[MAXN]; //sa[i]代表排名为i的后缀在原数列起始下标(数列的下标从0开始),sa[0]肯定等于n,因为标兵为最小的。
int rank[MAXN]; //rank[i]代表suffix[i]的排名,rank[n]肯定等于0,理由同上。
int height[MAXN]; //height[i]代表排名为i - 1的后缀 和排名为i的后缀 的最长公共连续子序列 的长度。
int r[MAXN]; //r[]存放原数列下标从0到n,r[n]为a标兵,是r[]里面最小的.
int n; //数列的元素个数,不包括标兵
int m; //存放最大值,r[]数组的数都要小于m,用来进行基数排序
void input(char *val, int len, int Max){//Max要大于r[0..len - 1],因为内部采用了基数排序
for (int i = 0;i < len;i++)
r[i] = val[i];
r[len] = 0; //最小值,起标兵作用
n = len;
m = Max;
calSa();
calHeight();
}
int cmp(int *r, int a, int b, int l){
return (r[a] == r[b] && r[a + l] == r[b + l]);
}
void calSa(){ //求sa数组
int i, j, p, *x = wa, *y = wb, *t;
for (i = 0;i < m;i++) ws[i] = 0;
for (i = 0;i < n + 1;i++) ws[x[i] = r[i]]++;
for (i = 1;i < m;i++) ws[i] += ws[i - 1];
for (i = n;i >= 0;i--) sa[--ws[x[i]]] = i;
for (j = 1, p = 1;p < n + 1;j *= 2, m = p){
for (p = 0, i = n - j + 1;i < n + 1;i++) y[p++] = i;
for (i = 0;i < n + 1;i++) if (sa[i] >= j) y[p++] = sa[i] - j;
for (i = 0;i < n + 1;i++) wv[i] = x[y[i]];
for (i = 0;i < m;i++) ws[i] = 0;
for (i = 0;i < n + 1;i++) ws[wv[i]]++;
for (i = 1;i < m;i++) ws[i] += ws[i - 1];
for (i = n;i >= 0;i--) sa[--ws[wv[i]]] = y[i];
for (t = x, x = y, y = t, p = 1, x[sa[0]] = 0, i = 1; i < n + 1;i++)
x[sa[i]] = cmp(y, sa[i - 1], sa[i], j) ? p - 1 : p++;
}
}
void calHeight(){ //求rank和height数组
int i, j, k = 0;
for (i = 1;i <= n;i++) rank[sa[i]] = i;
for (i = 0;i < n;height[rank[i++]] = k)
for (k?k--:0, j = sa[rank[i]- 1];r[i + k] == r[j + k];k++);
}
};
int main(){
int t;
cin >> t;
while (t--){
SuffixArray temp;
char s[MAXN];
cin >> s;
temp.input(s,strlen(s),256);
for(int i=1;i<=temp.n;i++) printf("%d ",temp.sa[i]);
printf("\n\n");
for(int i=1;i<=temp.n;i++) printf("%d ",temp.height[i]);
printf("\n\n");
long sum=0;
for (int i=1;i<=temp.n;i++) sum+=temp.n-temp.sa[i]-temp.height[i];
cout << sum << endl;
}
return 0;
}
后缀数组
最新推荐文章于 2021-07-27 20:07:22 发布