题目链接:点击这里
题目大意:
读入一个长度为
n
n
n 的由大小写英文字母或数字组成的字符串,请把这个字符串的所有非空后缀按字典序(用
ASCII
\text{ASCII}
ASCII 数值比较)从小到大排序,然后按顺序输出后缀的第一个字符在原串中的位置。位置编号为
1
1
1 到
n
n
n。
题目分析:
本题求的是字符串的
s
a
sa
sa 数组
下面记录一下后缀数组的各个变量的含义:
x
[
i
]
,
y
[
i
]
x[i],y[i]
x[i],y[i] 分别为基数排序的两个关键字
c
[
i
]
c[i]
c[i] 是基数排序的桶
s
a
[
i
]
sa[i]
sa[i] 是排名为
i
i
i 的后缀
r
k
[
i
]
rk[i]
rk[i] 是第
i
i
i 个后缀的排名
h
e
i
g
h
t
[
i
]
height[i]
height[i] 是排名第
i
i
i 的后缀和排名第
i
−
1
i-1
i−1 的后缀的最长公共前缀长度
我们记 l c p i , j lcp_{i,j} lcpi,j 为排名第 i , j i,j i,j 的后缀的最长公共前缀长度,其有如下性质:
- l c p i , i = i lcp_{i,i}=i lcpi,i=i
- l c p i , j = m i n l c p i , k , l c p k , j , i ≤ k ≤ j lcp_{i,j}=min{lcp_{i,k},lcp{k,j}},i\le k\le j lcpi,j=minlcpi,k,lcpk,j,i≤k≤j
- 由 2 2 2 可推广得 l c p i , j = m i n { l c p i , i + 1 , l c p i + 1 , i + 2 , . . . , l c p j − 1 , j } lcp_{i,j}=min\{lcp_{i,i+1},lcp_{i+1,i+2},...,lcp_{j-1,j}\} lcpi,j=min{lcpi,i+1,lcpi+1,i+2,...,lcpj−1,j}
令 h [ i ] = h e i g h t [ s a [ i ] ] h[i]=height[sa[i]] h[i]=height[sa[i]] ,其有性质: h [ i ] ≥ h [ i − 1 ] + 1 h[i]\ge h[i-1]+1 h[i]≥h[i−1]+1
具体细节见代码:
// Problem: P3809 【模板】后缀排序
// Contest: Luogu
// URL: https://www.luogu.com.cn/problem/P3809
// Memory Limit: 125 MB
// Time Limit: 2000 ms
//
// Powered by CP Editor (https://cpeditor.org)
//#pragma GCC optimize(2)
//#pragma GCC optimize("Ofast","inline","-ffast-math")
//#pragma GCC target("avx,sse2,sse3,sse4,mmx")
#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<cmath>
#include<vector>
#include<set>
#include<map>
#include<stack>
#include<queue>
#include<unordered_map>
#define ll long long
#define inf 0x3f3f3f3f
#define Inf 0x3f3f3f3f3f3f3f3f
//#define int ll
#define endl '\n'
#define IOS ios::sync_with_stdio(0); cin.tie(0); cout.tie(0)
using namespace std;
int read()
{
int res = 0,flag = 1;
char ch = getchar();
while(ch<'0' || ch>'9')
{
if(ch == '-') flag = -1;
ch = getchar();
}
while(ch>='0' && ch<='9')
{
res = (res<<3)+(res<<1)+(ch^48);//res*10+ch-'0';
ch = getchar();
}
return res*flag;
}
const int maxn = 1e6+5;
const int mod = 1e9+7;
const double pi = acos(-1);
const double eps = 1e-8;
int n,m,x[maxn<<1],y[maxn<<1],c[maxn],sa[maxn],rk[maxn],height[maxn];//y应该开两倍,因为y会访问到sa+k下标
char s[maxn];
void get_sa()
{
for(int i = 1;i <= n;i++) c[x[i]=s[i]]++;
for(int i = 1;i <= m;i++) c[i] += c[i-1];
for(int i = n;i;i--) sa[c[x[i]]--] = i;
for(int k = 1;k <= n;k <<= 1)
{
int id = 0;
for(int i = n-k+1;i <= n;i++) y[++id] = i;
for(int i = 1;i <= n;i++) if(sa[i] > k) y[++id] = sa[i]-k;
for(int i = 1;i <= m;i++) c[i] = 0;
for(int i = 1;i <= n;i++) c[x[i]]++;
for(int i = 1;i <= m;i++) c[i] += c[i-1];
for(int i = n;i;i--) sa[c[x[y[i]]]--] = y[i],y[i] = 0;
swap(x,y);
x[sa[1]] = 1,id = 1;
for(int i = 2;i <= n;i++)
x[sa[i]] = (y[sa[i]]==y[sa[i-1]] && y[sa[i]+k]==y[sa[i-1]+k]) ? id : ++id;
if(id == n) break;
m = id;
}
}
void get_height()
{
for(int i = 1;i <= n;i++) rk[sa[i]] = i;
for(int i = 1,k = 0;i <= n;i++)
{
if(rk[i] == 1) continue;
if(k) k--; //h[i]>=h[i-1]-1
int j = sa[rk[i]-1];
while(i+k<=n && j+k<=n && s[i+k]==s[j+k]) k++;
height[rk[i]] = k;
}
}
int main()
{
scanf("%s",s+1);
n = strlen(s+1),m = 'z';
get_sa();
get_height();
for(int i = 1;i <= n;i++) printf("%d%c",sa[i],i==n ? '\n' : ' ');
// for(int i = 1;i <= n;i++) printf("%d%c",height[i],i==n ? '\n' : ' ');
return 0;
}