后缀排序【模板】【后缀树组SA】

ssl_fuyang

已于 2022-08-16 19:22:11 修改

阅读量146

点赞数

分类专栏：自动机文章标签：算法 c++ 开发语言

于 2022-08-10 07:47:47 首次发布

本文链接：https://blog.csdn.net/qq_43010386/article/details/126258920

版权

自动机专栏收录该内容

8 篇文章 0 订阅

订阅专栏

>Link

luogu P3809

>Description

读入一个长度为 $n$ 的由大小写英文字母或数字组成的字符串，请把这个字符串的所有非空后缀按字典序（用 ASCII 数值比较）从小到大排序，然后按顺序输出后缀的第一个字符在原串中的位置。位置编号为 $1$ 到 $n$ 。

>解题思路

这是一道后缀树组模板题。

按字典序排序的原本思想就是先按照第一个字母排序，如果有排序序号相同的，就比较第二个字母……
那我们先把每个后缀按照第一关键字排序，就是把字符串的所有字符排个序。这个过程可以运用基数排序的思想 $O (n)$ 完成。
记 $sa_i$ 为排名为 $i$ 的后缀是哪一个，现在排完第一关键字，如果有相同的就排第二关键字
但是我们发现，第二关键字作为其他后缀的第一关键字已经排过序了，所以我们可以直接运用刚才的排序结果来排序，排完后把两个关键字排序的结果合在一起，作为新的第一关键字，继续排后面的关键字
在这个过程中我们可以发现，现在的第二关键字可以直接用第一关键字的排序，以及长度，因此这个排序过程实际上是倍增的，总的时间复杂度为 $O (n l o g n)$

>代码

#include <iostream>
#include <cstdio>
#include <cstring>
#include <algorithm>
#define N 1000010
using namespace std;

int n, m, x[N], y[N], sa[N], num, cnt[N];
string s;

int main()
{
	cin >> s;
	n = s.size();
	m = 122;
	s = " " + s;
	for (int i = 1; i <= n; i++) cnt[x[i] = s[i]]++; //桶
	for (int i = 1; i <= m; i++) cnt[i] += cnt[i - 1];
	for (int i = n; i >= 1; i--) sa[cnt[x[i]]--] = i; //基数排序
	//第一关键字
	for (int k = 1; k <= n; k <<= 1)
	{
		num = 0;
		for (int i = n - k + 1; i <= n; i++) y[++num] = i; //因为这个范围内的第二关键字是超出的，就是没有，所以把他们的第二关键字当做0，先加入序列
		for (int i = 1; i <= n; i++)
		  if (sa[i] > k) y[++num] = sa[i] - k;
		//记上第二关键字
		//y序列实际上是按照字典序排列好了，它存储第二关键字排序为i的后缀是哪一个
		for (int i = 1; i <= m; i++) cnt[i] = 0;
		for (int i = 1; i <= n; i++) cnt[x[i]]++;
		for (int i = 1; i <= m; i++) cnt[i] += cnt[i - 1];
		for (int i = n; i >= 1; i--) sa[cnt[x[y[i]]]--] = y[i], y[i] = 0; //基数排序
		swap (x, y);
		num = 1; x[sa[1]] = 1;
		for (int i = 2; i <= n; i++)
		{
			if (y[sa[i]] == y[sa[i - 1]] && y[sa[i] + k] == y[sa[i - 1] + k])
			  x[sa[i]] = num;
			else x[sa[i]] = ++num;
		}
		//更新x第一关键字排序
		if (num == n) break;
		m = num;
	}
	for (int i = 1; i <= n; i++)
	  printf ("%d ", sa[i]);
	return 0;
}