>Link
luogu P3809
>Description
读入一个长度为 n n n 的由大小写英文字母或数字组成的字符串,请把这个字符串的所有非空后缀按字典序(用 ASCII 数值比较)从小到大排序,然后按顺序输出后缀的第一个字符在原串中的位置。位置编号为 1 1 1 到 n n n。
>解题思路
这是一道后缀树组模板题。
按字典序排序的原本思想就是先按照第一个字母排序,如果有排序序号相同的,就比较第二个字母……
那我们先把每个后缀按照第一关键字排序,就是把字符串的所有字符排个序。这个过程可以运用基数排序的思想
O
(
n
)
O(n)
O(n)完成。
记
s
a
i
sa_i
sai 为排名为
i
i
i 的后缀是哪一个,现在排完第一关键字,如果有相同的就排第二关键字
但是我们发现,第二关键字作为其他后缀的第一关键字已经排过序了,所以我们可以直接运用刚才的排序结果来排序,排完后把两个关键字排序的结果合在一起,作为新的第一关键字,继续排后面的关键字
在这个过程中我们可以发现,现在的第二关键字可以直接用第一关键字的排序,以及长度,因此这个排序过程实际上是倍增的,总的时间复杂度为
O
(
n
l
o
g
n
)
O(nlogn)
O(nlogn)
>代码
#include <iostream>
#include <cstdio>
#include <cstring>
#include <algorithm>
#define N 1000010
using namespace std;
int n, m, x[N], y[N], sa[N], num, cnt[N];
string s;
int main()
{
cin >> s;
n = s.size();
m = 122;
s = " " + s;
for (int i = 1; i <= n; i++) cnt[x[i] = s[i]]++; //桶
for (int i = 1; i <= m; i++) cnt[i] += cnt[i - 1];
for (int i = n; i >= 1; i--) sa[cnt[x[i]]--] = i; //基数排序
//第一关键字
for (int k = 1; k <= n; k <<= 1)
{
num = 0;
for (int i = n - k + 1; i <= n; i++) y[++num] = i; //因为这个范围内的第二关键字是超出的,就是没有,所以把他们的第二关键字当做0,先加入序列
for (int i = 1; i <= n; i++)
if (sa[i] > k) y[++num] = sa[i] - k;
//记上第二关键字
//y序列实际上是按照字典序排列好了,它存储第二关键字排序为i的后缀是哪一个
for (int i = 1; i <= m; i++) cnt[i] = 0;
for (int i = 1; i <= n; i++) cnt[x[i]]++;
for (int i = 1; i <= m; i++) cnt[i] += cnt[i - 1];
for (int i = n; i >= 1; i--) sa[cnt[x[y[i]]]--] = y[i], y[i] = 0; //基数排序
swap (x, y);
num = 1; x[sa[1]] = 1;
for (int i = 2; i <= n; i++)
{
if (y[sa[i]] == y[sa[i - 1]] && y[sa[i] + k] == y[sa[i - 1] + k])
x[sa[i]] = num;
else x[sa[i]] = ++num;
}
//更新x第一关键字排序
if (num == n) break;
m = num;
}
for (int i = 1; i <= n; i++)
printf ("%d ", sa[i]);
return 0;
}