#include <iostream>
#include <algorithm>
#include <cstring>
#include <cstdio>
using namespace std;
const int maxn = 1e5+5;
class SuffixArray{
char str[maxn]; // 储存字符串
int n,m,sa[maxn],rak[maxn],tp[maxn],tax[maxn],Height[maxn];
/*
n -> The length of string
m -> The max value of string[i]
sa[i] -> 代表排名为i的后缀所在的位置
rak[i] -> 代表后缀位置为i的后缀的排名
tp[i] -> 基数排序辅助数组(第二关键词)
tax[i] -> 基数排序所用桶
*/
public:
init(){
cin >> (str+1); // 读入数据
for(int i = 1; i <= n; ++i) rak[i] = str[i] - '0',tp[i] = i;
}
void Index_Sort(){
for(int i = 0; i <= m; ++i) tax[i] = 0; // 清空桶(这里的m是指value)
for(int i = 1; i <= n; ++i) tax[rak[i]]++; // 将value相同的插入一个桶内
for(int i = 1; i <= n; ++i) tax[i] += tax[i-1]; // 求前缀和,这样就可以知道某一value至少排在第几位
for(int i = n; i >= 1; --i) sa[tax[rak[tp[i]]]--] = tp[i]; // 按第一关键字与第二关键词排序
}
void Suffix_Sort(){ // 后缀排序
m = 75; // 一般自己设置 or 题目给出
n = strlen(str+1);
Index_Sort();
for(int w = 1,p = 0; p < n; m = p,w <<= 1){
/*
w: 当前倍增长度, w = x 表示已经求出长度为x的后缀的排名,
现在要更新长度为2x的后缀的排名
p: 表示不同的后缀的个数
*/
p = 0; // 计数作用
/*
更新第二关键词tp[i]
这两句话是对第二关键字进行排序
假设我们现在需要得到的长度为w,
那么sa[i]表示的实际是长度为w2的后缀中排名为i的位置
(也就是上一轮的结果)
我们需要得到的tp[i]表示的是:长度为w的后缀中,第二关键字排名为i的位置。
*/
for(int i = 1; i <= w; ++i) tp[++p] = n - w + i; // 后w个会成为其他人的第二关键字
for(int i = 1; i <= n; ++i){
if(sa[i] > w)
tp[++p] = sa[i] - w; // sa[i] > w的也会成为其他人的第二关键字
}
Index_Sort();
swap(tp,rak);
rak[sa[1]] = p = 1;
for(int i = 2; i <= n; ++i){
rak[sa[i]] = (tp[sa[i - 1]] == tp[sa[i]] && tp[sa[i - 1] + w] == tp[sa[i] + w]) ? p : ++p;
// 看一下有没有相同排名的
// 如果有相同排名说明还得继续
}
}
}
void Get_Height(){
int j, k = 0;
for(int i = 1; i <= n; i++) {
if(k) k--;
int j = sa[rak[i] - 1];
while(str[i + k] == str[j + k]) k++;
Height[rak[i]] = k;
}
}
};
int main()
{
return 0;
}
后缀数组
最新推荐文章于 2023-04-10 11:25:04 发布